CEO OpenAI: Tác tử AI Deep Research giống một siêu năng lực
OpenAI vừa giới thiệu tác tử trí tuệ nhân tạo (AI) mới có tên Deep Research.
Tác tử AI là hệ thống hoặc chương trình máy tính được thiết kế để thực hiện các tác vụ tự động bằng cách sử dụng AI. Các tác tử AI có khả năng tương tác với môi trường, thu thập thông tin, xử lý dữ liệu, ra quyết định và thực hiện các hành động dựa trên mục tiêu được đặt ra.
Đặc điểm của một tác tử AI
Tự động: Có khả năng hoạt động độc lập mà không cần sự can thiệp của con người trong suốt quá trình xử lý.
Nhận thức môi trường: Có thể cảm nhận hoặc thu thập dữ liệu từ môi trường thông qua các cảm biến, API, hoặc dữ liệu được cung cấp.
Ra quyết định: Dựa trên các thuật toán hoặc mô hình học máy, tác tử AI có thể phân tích dữ liệu và chọn hành động phù hợp.
Hành động: Tác tử thực hiện các hành động cụ thể để đạt được mục tiêu, ví dụ như gửi thông báo, điều khiển thiết bị, hoặc cập nhật dữ liệu.
Các loại tác tử AI phổ biến
Reactive Agent (tác tử phản ứng): Hoạt động dựa trên các quy tắc đơn giản và phản ứng ngay lập tức với những thay đổi trong môi trường.
Goal-based Agent (tác tử dựa trên mục tiêu): Được thiết kế để đạt được một hoặc nhiều mục tiêu cụ thể thông qua việc lập kế hoạch và hành động.
Learning Agent (tác tử học tập): Sử dụng các kỹ thuật học máy để tự cải thiện hiệu suất và khả năng ra quyết định qua thời gian.
Multi-agent Systems (hệ thống đa tác tử): Một nhóm các tác tử AI hoạt động cùng nhau để giải quyết các nhiệm vụ phức tạp.
Ứng dụng của tác tử AI
Trợ lý ảo: Siri, Alexa, Google Assistant.
Tác tử tìm kiếm: Công cụ thu thập dữ liệu và cung cấp thông tin từ internet.
Tự động hóa công việc: Robot xử lý tài liệu, chatbot trả lời khách hàng.
Điều khiển hệ thống: Tác tử AI trong các hệ thống thông minh như nhà thông minh, ô tô tự hành.
Tác tử AI là một phần quan trọng trong sự phát triển của trí AI, được ứng dụng rộng rãi trong nhiều lĩnh vực như chăm sóc sức khỏe, giáo dục, dịch vụ khách hàng và công nghiệp.
Deep Research được vận hành bởi mô hình o3 của OpenAI sắp ra mắt, được tối ưu hóa cho duyệt web và phân tích dữ liệu.
Tác tử AI mới này có khả năng thực hiện nghiên cứu nhiều bước trên internet cho các nhiệm vụ phức tạp mà theo OpenAI, "hoàn thành trong vài chục phút những gì con người phải mất nhiều giờ".
Bạn chỉ cần cung cấp một yêu cầu là Deep Research sẽ “tìm kiếm, phân tích và tổng hợp hàng trăm nguồn trực tuyến để tạo ra một báo cáo toàn diện ở cấp độ của nhà phân tích nghiên cứu”.
OpenAI đã trình diễn Deep Research trong video được chia sẻ hôm 2.2.
Deep Research phục vụ cho các chuyên gia trong lĩnh vực tài chính, khoa học, chính sách và kỹ thuật, cung cấp những thông tin chi tiết đáng tin cậy và toàn diện. Tính năng này cũng hữu ích với những người mua sắm đang tìm kiếm các đề xuất được cá nhân hóa về giao dịch mua đòi hỏi phải nghiên cứu cẩn thận, chẳng hạn ô tô, đồ gia dụng và đồ nội thất.
Kết quả gồm các trích dẫn và tóm tắt rõ ràng, giúp dễ dàng xác minh. Về cơ bản, Deep Research giúp tinh giản quá trình nghiên cứu tốn thời gian, cung cấp thông tin chuyên sâu hiệu quả chỉ từ một truy vấn.
Trong loạt bài đăng trên mạng xã hội X hôm 2.2, Sam Altman (Giám đốc điều hành OpenAI) đã mô tả Deep Research là "giống một siêu năng lực, hoạt động như nhóm chuyên gia sẵn sàng hỗ trợ bạn".
Sam Altman cho biết Deep Research có thể "sử dụng internet, thực hiện nghiên cứu, lập luận phức tạp và trả về cho bạn một báo cáo", xử lý các nhiệm vụ "mất nhiều giờ/ngày và tốn hàng trăm USD".
Dù rất tốn nhiều tài nguyên tính toán và hoạt động còn chậm, ông tuyên bố "Deep Research là hệ thống AI đầu tiên có thể thực hiện nhiều nhiệm vụ phức tạp, có giá trị như vậy".
Deep Research mất từ 5 đến 30 phút để hoàn thành công việc và bạn sẽ nhận được thông báo khi nghiên cứu xong. Kết quả cuối cùng là một báo cáo được gửi qua ChatGPT.
Hiện báo cáo chỉ có văn bản nhưng OpenAI cho biết trong những tuần tới, họ sẽ thêm hình ảnh nhúng, biểu đồ dữ liệu và các kết quả phân tích khác để tăng thêm độ rõ ràng và ngữ cảnh.
Deep Research hiện có sẵn như một phần gói Pro của OpenAI (giá 200 USD/tháng), với 100 truy vấn có sẵn mỗi tháng trên web. Nó sẽ có trên ứng dụng dành cho thiết bị di động và PC vào cuối tháng 2. Tính năng này cũng sẽ sớm khả dụng với khách hàng Plus, Team và Enterprise trước khi đến với gói miễn phí của OpenAI.
Sam Altman kêu gọi mọi người "hãy thử nghiệm Deep Research với công việc khó khăn nhất mà bạn phải giải quyết bằng cách sử dụng internet và xem điều gì sẽ xảy ra".
Tuy nhiên, OpenAI cảnh báo rằng Deep Research “có thể gặp khó khăn trong việc phân biệt thông tin có thẩm quyền với tin đồn và đang có điểm yếu trong việc hiệu chỉnh độ tin cậy (chưa thể đánh giá chính xác mức độ đáng tin cậy của thông tin đưa ra – PV), không thể hiện rõ thông tin chưa chắc chắn khiến người dùng có thể hiểu nhầm".
Theo OpenAI, khi Deep Research mới ra mắt, người dùng cũng có thể thấy các lỗi định dạng nhỏ trong báo cáo và trích dẫn, với các nhiệm vụ có thể mất nhiều thời gian hơn để bắt đầu.
"Chúng tôi kỳ vọng tất cả những vấn đề này sẽ nhanh chóng được cải thiện khi có thêm người dùng và thời gian", OpenAI cho hay.
Deep Research trình làng một tuần sau khi OpenAI giới thiệu một tác tử AI khác có tên Operator, hoạt động như trợ lý cho con người, thực hiện các tác vụ dựa trên web như đặt chỗ, chuyến đi và hàng tạp hóa theo yêu cầu của bạn.
OpenAI giải thích rằng Operator là một tác tử sử dụng máy tính (CUA) dựa trên mô hình GPT-4o, có thể thực hiện các chức năng đa phương thức, chẳng hạn khả năng tìm kiếm trên web và phân tích, hiểu được lý do tại sao các kết quả này phù hợp hoặc có liên quan đến câu hỏi hoặc mục đích tìm kiếm.
Tuy nhiên, những người có cơ hội thử nghiệm Operator đã đưa ra một số lời phàn nàn, chẳng hạn phản hồi chậm so với bản demo và bị "ảo giác" giống chatbot ChatGPT, theo trang Quartz.
Ảo giác trong ngữ cảnh AI và học máy là hiện tượng khi một mô hình hay chatbot AI tạo ra thông tin không chính xác hoặc hoàn toàn không tồn tại, nhưng lại trình bày nó một cách có vẻ hợp lý và thuyết phục.
Trang Bezingza cho biết một số lời nàn về Operator từ người dùng mạng xã hội X đã thu hút được sự chú ý của Sam Altman. Theo Bezingza, một người dùng X đã chia sẻ các vấn đề về tương tác của Operation với một trang web tin tức. Sam Altman đã trả lời, hứa sẽ khắc phục sự cố ngay lập tức. Tuy nhiên, vấn đề mà người dùng gặp phải có thể là một dạng "ảo giác".
Dù nhiều người ấn tượng với các tính năng của Operator được OpenAI giới thiệu trong bản demo, giá cả vẫn là rào cản lớn khiến họ không muốn thử nghiệm tác tử AI này. Operator hiện có sẵn theo gói ChatGPT Pro trị giá 200 USD mỗi tháng của OpenAI, khiến nó trở thành một trải nghiệm khá độc quyền.
Chris Smith, cây viết của trang BGR, lưu ý rằng anh là người đăng ký ChatGPT Plus giá 20 USD/tháng, nhưng không thể biện minh cho việc trả 200 USD/tháng để truy cập Operator. Tuy nhiên, OpenAI dự kiến sẽ đưa Operator vào gói ChatGPT Plus, Team và Enterprise trong tương lai.
Một trong những lời phàn nàn lớn nhất của người dùng là Operator hiện chỉ khả dụng tại Mỹ. Người dùng châu Âu và châu Á bày tỏ sự thất vọng vì không thể truy cập được tác tử AI này.
Trang ComputerWorld cũng lưu ý các tác tử AI nói chung có khả năng gây ra rủi ro về an toàn, chẳng hạn sử dụng các hệ sinh thái tự động để thực hiện các cuộc tấn công lưu lượng truy cập hoặc vượt qua mã CAPTCHA. Dù OpenAI khẳng định đảm bảo an toàn cho Operator, ComputerWorld đã phỏng vấn các nhà nghiên cứu lưu ý rằng công nghệ này có thể xung đột với các công cụ tìm kiếm như Google, vốn có các chiến lược xử lý dữ liệu riêng cho mục đích của mình.