- vừa được xem lúc

Google làm gì để đối đầu với OpenAI trong cuộc đua AI?

0 0 6

Người đăng: Nguyen Ngoc Hung

Theo Viblo Asia

1. Giới thiệu

Google I/O là một sự kiện hội thảo thường niên do Google tổ chức, tập trung vào các sản phẩm và công nghệ mới nhất của công ty. "I/O" trong tên sự kiện là viết tắt của "Innovation in the Open" (Sáng tạo trong mở) và "Input/Output" (Đầu vào/Đầu ra), thể hiện cam kết của Google đối với sự đổi mới và tương tác với cộng đồng phát triển. Sự kiện này thu hút hàng ngàn nhà phát triển, chuyên gia công nghệ, và những người yêu công nghệ từ khắp nơi trên thế giới đến tham dự và tìm hiểu về những tiến bộ mới nhất trong các lĩnh vực như AI, ML (machine learning) , cloud computing và nhiều lĩnh vực khác.

Google I/O 2024 là một sự kiện đặc biệt với nhiều điểm nhấn quan trọng, đặc biệt là trong bối cảnh cạnh tranh mạnh mẽ với các công nghệ AI tiên tiến và với đối thủ cạnh tranh trực tiếp Open AI với màn ra mắt ấn tượng của ChatGPT-4o (mình đã có bài viết về ChatGPT-4o bạn có thể đọc thêm tại đây).

Trong bài viết này, mình sẽ tổng hợp lại những cập nhật của Google trong lĩnh vực AI được nói đến ở sự kiện Google I/O 2024.

og-image.jpeg

2. Những điểm nổi bật về AI

2.1 Gemini 1.5 Pro

Google Gemini là AI tiên tiến của Google, được thiết kế để nâng cao khả năng hiểu biết, tương tác và tạo nội dung một cách tự nhiên và hiệu quả. Với sự kết hợp của các thuật toán ML (Machine Learning) tiên tiến và khả năng xử lý data mạnh mẽ, Google Gemini mang lại những phản hồi chính xác và hữu ích trong thời gian thực.

Gemini 1.5 Pro sẽ có những update mạnh mẽ với sự mở rộng cửa sổ ngữ cảnh lên đến 2M tokens. Google sẽ tích hợp Gemini trong Workspace Labs. Từ giờ tất cả các trải nghiệm của bạn trên Google Workspace đều được tích hợp thêm với Gemini. Ví dụ như nó có thể giúp bạn tóm tắt các email mà bạn yêu cầu, videos, tìm kiếm ảnh dựa vào nội dung.. Đây là một điểm cộng khá lớn của Google nó rất tiện dụng và dễ dàng thực hiện. Google cũng nói đến hai tiến bộ kĩ thuật là Multimodality và Long Context giúp mở khoá các nhiều khả năng hơn và thông mình hơn.

2.2 Gemini 1.5 Flash

Gemini 1.5 Flash là phiên bản nhẹ hơn của Gemini để phục vụ ở quy mô lớn không chỉ là một công cụ mạnh mẽ cho developers mà còn là một giải pháp tối ưu cho các doanh nghiệp muốn nâng cao hiệu suất và cải thiện trải nghiệm người dùng. Với những tính năng và lợi ích vượt trội như nhanh chóng và tiết kiệm chi phí.

2.3 Veo

Veo là một mô hình mới để xử lí hay tạo video. Nó có thể tạo các video có độ phân giải 1080p từ input là văn bản theo các phong cách hình ảnh hay điện ảnh khác nhau. Nó tương tự như Sora của Open AI

2.4 Project Astra

Project Astra hiểu đơn giản nó như một trợ lý AI giúp trả lời bất cứ các câu hỏi nào của bạn real-time. Cá nhân mình thấy về phần này thì Open AI làm tốt hơn với Chat GPT-4o. Project Astra về cảm xúc cũng như ngữ điệu không đạt được tự nhiên như Chat GPT-4o.

2.5 Tính năng mới của Google Search

Trước đây bạn có thể tìm kiếm google bằng text, hình ảnh (google images), âm thanh nhưng bây giờ bạn có thể tìm kiếm bằng cả video. Bạn có thể đặt câu hỏi cho Google bằng video và kết quả trả về ngay lập tức. Nó thực sự rất bổ ích =))).

2.6 Gems

Gems là một tính năng mới cho phép tuỳ chỉnh nó theo nhu cầu riêng của bạn và tạo ra các chuyến gia trong lĩnh vực mà bạn muốn. Bạn có thể upload một file PDF dài tới 15 trang hoặc nhiều file có thông tin về một dự án nào đó.

2.7 LernLM

LernLM là một mô hình mới dựa trên Gemini và tinh chỉnh để học tập. Ví dụ như dùng Youtube sau này sẽ trở nên thú vị và nhiều tương tác hơn với việc cho phép đặt các câu hỏi ngay dưới video và sẽ nhận được ngay lời giải thích hữu ích bởi LernLM.

Google cũng thông báo rằng Gemini 2 sẽ được phát hành vào tháng 6/2024 với 27 tỷ params hãy cùng đợi và trải nghiệm!!!

3. Tài liệu tham khảo

Bình luận

Bài viết tương tự

- vừa được xem lúc

Các thuật toán cơ bản trong AI - Phân biệt Best First Search và Uniform Cost Search (UCS)

Nếu bạn từng đọc các thuật toán trong AI (Artificial Intelligence - Trí tuệ nhân tạo), rất có thể bạn từng nghe qua về các thuật toán tìm kiếm cơ bản: UCS (thuộc chiến lược tìm kiếm mù) và Best First Search (thuộc chiến lược tìm kiếm kinh nghiệm). Khác nhau rõ từ khâu phân loại rồi, thế nhưng hai th

0 0 164

- vừa được xem lúc

Con đường AI của tôi

Gần đây, khá nhiều bạn nhắn tin hỏi mình những câu hỏi đại loại như: có nên học AI, bắt đầu học AI như nào, làm sao tự học cho đúng, cho nhanh, học không bị nản, lộ trình học AI như nào... Sau nhiều lần trả lời, mình nghĩ rằng nên viết hẳn một bài để trả lời chi tiết hơn, cũng như để các bạn sau này

0 0 148

- vừa được xem lúc

[ChatterBot] Thư viện chatbot hay ho dành cho Python| phần 3

Trong bài trước mình đã trình bày về Training data cho chatbot và tiền xử lý dữ liệu. Trong phần này sẽ trình bày với các bạn về logic adapter.

0 0 57

- vừa được xem lúc

[Deep Learning] Kỹ thuật Dropout (Bỏ học) trong Deep Learning

. Trong bài viết này, mình xin phép giới thiệu về Dropout (Bỏ học) trong mạng Neural, sau đó là mình sẽ có 1 số đoạn code để xem Dropout ảnh hưởng thế nào đến hiệu suất của mạng Neural. 1.1. Dropout trong mạng Neural là gì.

0 0 57

- vừa được xem lúc

Kỹ thuật Dropout (Bỏ học) trong Deep Learning

Trong bài viết này, mình xin phép giới thiệu về Dropout (Bỏ học) trong mạng Neural, sau đó là mình sẽ có 1 số đoạn code để xem Dropout ảnh hưởng thế nào đến hiệu suất của mạng Neural. 1.

0 1 75

- vừa được xem lúc

Blockchain dưới con mắt làng Vũ Đại 4.0

Mở bài. Hey nhô các bạn, lại là mình đây .

0 0 47