1. Giới thiệu
Google I/O là một sự kiện hội thảo thường niên do Google tổ chức, tập trung vào các sản phẩm và công nghệ mới nhất của công ty. "I/O" trong tên sự kiện là viết tắt của "Innovation in the Open" (Sáng tạo trong mở) và "Input/Output" (Đầu vào/Đầu ra), thể hiện cam kết của Google đối với sự đổi mới và tương tác với cộng đồng phát triển. Sự kiện này thu hút hàng ngàn nhà phát triển, chuyên gia công nghệ, và những người yêu công nghệ từ khắp nơi trên thế giới đến tham dự và tìm hiểu về những tiến bộ mới nhất trong các lĩnh vực như AI, ML (machine learning) , cloud computing và nhiều lĩnh vực khác.
Google I/O 2024 là một sự kiện đặc biệt với nhiều điểm nhấn quan trọng, đặc biệt là trong bối cảnh cạnh tranh mạnh mẽ với các công nghệ AI tiên tiến và với đối thủ cạnh tranh trực tiếp Open AI với màn ra mắt ấn tượng của ChatGPT-4o (mình đã có bài viết về ChatGPT-4o bạn có thể đọc thêm tại đây).
Trong bài viết này, mình sẽ tổng hợp lại những cập nhật của Google trong lĩnh vực AI được nói đến ở sự kiện Google I/O 2024.
2. Những điểm nổi bật về AI
2.1 Gemini 1.5 Pro
Google Gemini là AI tiên tiến của Google, được thiết kế để nâng cao khả năng hiểu biết, tương tác và tạo nội dung một cách tự nhiên và hiệu quả. Với sự kết hợp của các thuật toán ML (Machine Learning) tiên tiến và khả năng xử lý data mạnh mẽ, Google Gemini mang lại những phản hồi chính xác và hữu ích trong thời gian thực.
Gemini 1.5 Pro sẽ có những update mạnh mẽ với sự mở rộng cửa sổ ngữ cảnh lên đến 2M tokens. Google sẽ tích hợp Gemini trong Workspace Labs. Từ giờ tất cả các trải nghiệm của bạn trên Google Workspace đều được tích hợp thêm với Gemini. Ví dụ như nó có thể giúp bạn tóm tắt các email mà bạn yêu cầu, videos, tìm kiếm ảnh dựa vào nội dung.. Đây là một điểm cộng khá lớn của Google nó rất tiện dụng và dễ dàng thực hiện. Google cũng nói đến hai tiến bộ kĩ thuật là Multimodality và Long Context giúp mở khoá các nhiều khả năng hơn và thông mình hơn.
2.2 Gemini 1.5 Flash
Gemini 1.5 Flash là phiên bản nhẹ hơn của Gemini để phục vụ ở quy mô lớn không chỉ là một công cụ mạnh mẽ cho developers mà còn là một giải pháp tối ưu cho các doanh nghiệp muốn nâng cao hiệu suất và cải thiện trải nghiệm người dùng. Với những tính năng và lợi ích vượt trội như nhanh chóng và tiết kiệm chi phí.
2.3 Veo
Veo là một mô hình mới để xử lí hay tạo video. Nó có thể tạo các video có độ phân giải 1080p từ input là văn bản theo các phong cách hình ảnh hay điện ảnh khác nhau. Nó tương tự như Sora của Open AI
2.4 Project Astra
Project Astra hiểu đơn giản nó như một trợ lý AI giúp trả lời bất cứ các câu hỏi nào của bạn real-time. Cá nhân mình thấy về phần này thì Open AI làm tốt hơn với Chat GPT-4o. Project Astra về cảm xúc cũng như ngữ điệu không đạt được tự nhiên như Chat GPT-4o.
2.5 Tính năng mới của Google Search
Trước đây bạn có thể tìm kiếm google bằng text, hình ảnh (google images), âm thanh nhưng bây giờ bạn có thể tìm kiếm bằng cả video. Bạn có thể đặt câu hỏi cho Google bằng video và kết quả trả về ngay lập tức. Nó thực sự rất bổ ích =))).
2.6 Gems
Gems là một tính năng mới cho phép tuỳ chỉnh nó theo nhu cầu riêng của bạn và tạo ra các chuyến gia trong lĩnh vực mà bạn muốn. Bạn có thể upload một file PDF dài tới 15 trang hoặc nhiều file có thông tin về một dự án nào đó.
2.7 LernLM
LernLM là một mô hình mới dựa trên Gemini và tinh chỉnh để học tập. Ví dụ như dùng Youtube sau này sẽ trở nên thú vị và nhiều tương tác hơn với việc cho phép đặt các câu hỏi ngay dưới video và sẽ nhận được ngay lời giải thích hữu ích bởi LernLM.
Google cũng thông báo rằng Gemini 2 sẽ được phát hành vào tháng 6/2024 với 27 tỷ params hãy cùng đợi và trải nghiệm!!!