Gemini vượt khỏi ranh giới chatbot
Các cải tiến xoay quanh Gemini cho thấy hướng đi mới của Google khi dồn trọng tâm từ giao diện chatbot sang tác nhân (agent) hoạt động liên tục.

CEO Sundar Pichai phát biểu tại Google I/O 2026. Ảnh: Android Central.
Tại hội nghị I/O 2026 diễn ra rạng sáng 20/5 (giờ Việt Nam), Google công bố phiên bản mới nhất của Gemini cùng mô hình AI mô phỏng thế giới vật lý mang tên Omni.
Theo CNET, sự kiện diễn ra trong bối cảnh Google chạy đua để bắt kịp tốc độ phát triển các mô hình AI, đồng thời cung cấp nhiều dịch vụ cho lượng người dùng khổng lồ.
I/O 2026 cũng là điểm nhấn khi thị trường tập trung vào mức định giá tăng vọt của OpenAI và Anthropic, cả 2 dự kiến phát hành cổ phiếu lần đầu ra công chúng (IPO) trong năm nay.
Gemini 3.5 Flash với tốc độ nhanh, tiết kiệm chi phí
Trọng tâm của Google vẫn xoay quanh hệ sinh thái Gemini. Tại sự kiện, công ty giới thiệu vào Gemini 3.5 Flash, phiên bản rút gọn nhưng vẫn đảm bảo hiệu quả với chi phí còn một nửa, thậm chí 1/3 so với các mô hình tiên tiến tương đương.
Trả lời phóng viên trước sự kiện, CEO Sundar Pichai chia sẻ Gemini 3.5 Flash "nhanh đến kinh ngạc". Google cho biết đây sẽ là mô hình mặc định trong Gemini và chế độ AI của Google Search trên toàn cầu.
"Bạn không còn phải đánh đổi chất lượng cho tốc độ nữa", thông báo của Google nhấn mạnh. Công ty cho biết khả năng bảo vệ tấn công mạng của Gemini 3.5 Flash được cải thiện, giảm tỷ lệ tạo nội dung độc hại và từ chối nhầm các câu lệnh bình thường.

Gemini 3.5 Flash được tuyên bố cho hiệu quả cao với tốc độ đầu ra nhanh. Ảnh: Google.
Gemini 3.5 Flash được tối ưu cho các quy trình làm việc phức tạp mang tính tác nhân (agent). Theo Google, mô hình vượt trội hơn Gemini 3.1 Pro trên nhiều thang điểm, chẳng hạn như Terminal-Bench 2.1 (76,2% so với 70,3%) hay MCP Atlas (83,6% so với 78,2%).
Khi xem xét số lượng token đầu ra mỗi giây, Gemini 3.5 Flash nhanh gấp 4 lần so với một số mô hình mới khác. Theo Google, mô hình có thể rút ngắn thời gian hoàn tất một số tác vụ vốn trước đây mất nhiều ngày hoặc nhiều tuần với chi phí thấp hơn, tối ưu cho cả lập trình viên, doanh nghiệp, nhà khoa học và người dùng phổ thông.
"Để dễ hình dung, các công ty lớn đang xử lý khoảng 1.000 tỷ token mỗi ngày. Nếu chuyển dịch 80% khối lượng công việc đó sang 3.5 Flash, họ sẽ tiết kiệm được hơn 1 tỷ USD/năm, một nguồn vốn thực tế có thể tái đầu tư trực tiếp vào doanh nghiệp", Pichai nhấn mạnh.
Sau Gemini 3.5 Flash, Google tiết lộ Gemini 3.5 Pro đang được phát triển và sử dụng nội bộ, dự kiến ra mắt rộng rãi trong tháng 6.
Mở rộng Gemini
Ứng dụng Gemini cũng được thiết kế lại với ngôn ngữ Neural Expressive. Điểm mới đến từ Gemini Spark, tác nhân AI cá nhân hoạt động liên tục. Tính năng này vận hành dựa trên nền tảng Gemini 3.5, có thể kết nối trực tiếp với Gmail, Google Docs hay Slides.
Khác biệt của Gemini Spark đến từ khả năng chạy ngầm, có thể vận hành kể cả khi người dùng khóa điện thoại hay máy tính.
Một số công dụng của Spark như phân tích sao kê thẻ tín dụng hàng tháng để cảnh báo phí thuê bao hoặc chi phí ẩn, kiểm tra email để trích xuất và tổng hợp thông tin quan trọng, tóm tắt cuộc họp rồi viết lên Google Docs...

Những tính năng mới sắp có mặt trên ứng dụng Gemini. Ảnh: Google.
Trên Android, người dùng có thể theo dõi cập nhật trực tiếp và tiến độ thực hiện tác vụ của các tác nhân như Spark thông qua giao diện mới mang tên Android Halo, dự kiến ra mắt vào cuối năm nay.
Đến cuối mùa hè này, Spark cũng sẽ vận hành trực tiếp trong Chrome, biến trình duyệt trở thành agent hỗ trợ người dùng trên Internet.
Để đảm bảo quyền riêng tư, người dùng có thể không kích hoạt Gemini Spark, cũng như chọn các ứng dụng được kết nối. Tính năng này dự kiến được triển khai thử nghiệm từ cuối tháng 5 cho thuê bao Google AI Ultra tại Mỹ.
Daily Brief cũng là tính năng mới trên Gemini, có thể cung cấp bản tóm tắt cá nhân hóa vào mỗi buổi sáng. Các thông tin được tổng hợp từ email và lịch để tạo ra báo cáo ngắn gọn.

Tính năng tóm tắt Daily Brief trong ứng dụng Gemini. Ảnh: Google.
Người dùng có thể yêu cầu loại thông tin cần ưu tiên, thậm chí hướng dẫn bước xử lý tiếp theo để AI vận hành. Hiện tại, Daily Brief mới hỗ trợ thuê bao AI Plus, Pro và Ultra tại thị trường Mỹ.
Google cũng tiết lộ một số cập nhật cho ứng dụng Gemini trên macOS, bao gồm tích hợp Gemini Spark để xử lý và tự động hóa các quy trình làm việc.
Hệ thống nhận diện giọng nói Rambler cũng được hỗ trợ trên phiên bản macOS, có thể loại bỏ các từ thừa để chuyển đổi giọng nói thành văn bản mượt mà hơn.
Sáng tạo video với Gemini Omni
Gemini Omni là mô hình mô phỏng thế giới vật lý. Trước đây, DeepMind đã phát triển một số mô hình tương tự, nhưng chỉ dùng trong lĩnh vực robot và game.
Với Omni, người dùng có thể kết hợp hình ảnh, âm thanh và văn bản để tạo ra video chất lượng cao, dựa trên nền tảng kiến thức về thế giới thực của Gemini.
Theo Google, Omni có thể áp dụng các định luật vật lý vào bối cảnh một cách chính xác, chẳng hạn như lực hấp dẫn, động năng và động lực học chất lưu. Nhờ kiến thức sẵn có từ Gemini, mô hình có khả năng dự đoán diễn biến tiếp theo.
Một video tạo bởi Gemini Omni. Ảnh: Google.
Mô hình hỗ trợ chỉnh sửa bằng ngôn ngữ tự nhiên, bối cảnh luôn duy trì nhất quán qua mỗi lần chỉnh. Thông qua câu lệnh, người dùng có thể dễ dàng thêm nhân vật, chèn vật thể hoặc thay đổi khung cảnh.
Omni cũng hỗ trợ tạo avatar ảo với ngoại hình, giọng nói giống ngoài đời. Các video đều có ảnh chìm (watermark) SynthID để nhận biết nội dung tạo bởi AI.
Google cho biết phiên bản đầu tiên mang tên Gemini Omni Flash sẽ được triển khai trong ứng dụng Gemini, Flow và YouTube Shorts. Trong thời gian tới, mô hình này sẽ hỗ trợ đầu ra hình ảnh và âm thanh.
Google nhấn mạnh khả năng mô phỏng chính xác thế giới vật lý của Gemini Omni. Ảnh: Google.
Về Google, chi phí đầu tư ngày càng lớn khiến Phố Wall đặt ra nhiều kỳ vọng. Theo CNET, giới đầu tư muốn thấy công ty tích hợp sâu AI vào các sản phẩm cốt lõi nhằm tạo ra lợi nhuận bền vững. Các công cụ tác nhân (agent) có thể đóng vai trò quan trọng.
Các agent thông minh như Spark hay Daily Brief là câu trả lời của Google. Thông qua sự kết hợp của Gemini 3.5 Flash tối ưu chi phí và Omni, hãng đang nỗ lực giữ vững vị thế trước các đối thủ cạnh tranh.
Không chỉ riêng Google, kỳ vọng dành cho các công ty AI tiếp tục tăng cao, đặc biệt sau khi Anthropic công bố Mythos. Mô hình này được tuyên bố mạnh đến mức có thể phát hiện hàng nghìn lỗ hổng bảo mật chưa từng thấy trong cơ sở hạ tầng phần mềm toàn cầu.
Nguồn Znews: https://znews.vn/gemini-vuot-khoi-ranh-gioi-chatbot-post1652959.html







![[VIDEO] Bộ Công an đề xuất phạt tới 30 triệu đồng vi phạm bản quyền mạng](https://photo-baomoi.bmcdn.me/w250_r3x2/2026_05_22_180_55215391/2333e1cecd8524db7d94.jpg)



