CEO OpenAI: GPT-5 có trình độ tiến sĩ nhưng vẫn thiếu khả năng tự học

OpenAI rạng sáng 8.8 (giờ Việt Nam) đã ra mắt GPT-5, phiên bản mới nhất của mô hình ngôn ngữ lớn, góp phần làm thay đổi nền kinh doanh và văn hóa toàn cầu.

Các mô hình GPT của OpenAI chính là công nghệ trí tuệ nhân tạo (AI) làm nền tảng cho chatbot ChatGPT đình đám. Công ty khởi nghiệp OpenAI cho biết GPT-5 sẽ được cung cấp cho toàn bộ 700 triệu người dùng ChatGPT.

Video giới giới thiệu GPT-5.

Câu hỏi lớn đặt ra là liệu OpenAI, công ty đã khởi xướng cơn sốt AI tạo sinh, có thể tiếp tục tạo ra những bước tiến công nghệ đủ mạnh để thu hút khách hàng doanh nghiệp, qua đó biện minh cho khoản tiền khổng lồ mà họ đang đổ vào để thúc đẩy sự phát triển này hay không.

Việc phát hành GPT-5 diễn ra vào thời điểm quan trọng với ngành AI. Các hãng phát triển AI lớn nhất thế giới như Alphabet (công ty mẹ Google), Meta Platforms, Amazon và Microsoft (hậu thuẫn cho OpenAI) đã tăng mạnh chi tiêu vốn để xây dựng các trung tâm dữ liệu AI, làm tăng kỳ vọng của giới đầu tư về lợi nhuận khổng lồ. Bốn hãng công nghệ lớn Mỹ dự kiến sẽ chi tổng cộng gần 400 tỉ USD trong năm tài chính này.

Sam Altman: GPT-5 là “bước tiến quan trọng trên con đường tới trí tuệ nhân tạo tổng quát"

GPT 5 ít bị ảo giác hơn các mô hình AI trước đó

GPT 5 nâng cấp tối ưu cho người dùng và nhà phát triển

OpenAI đang trong giai đoạn thảo luận ban đầu để cho phép nhân viên bán lại số cổ phiếu trị giá hàng tỉ USD để đạt được mức định giá 500 tỉ USD, tăng mạnh so với mức 300 tỉ USD hiện tại.

Trong khi đó, cuộc chiến giành nhân tài AI ở Thung lũng Silicon (Mỹ) đang diễn ra vô cùng khốc liệt và các nhà nghiên cứu hàng đầu hiện có thể nhận khoản lương thưởng lên tới hàng trăm triệu USD.

“Đến nay, chi tiêu của doanh nghiệp cho AI vẫn chưa nhiều, trong khi chi tiêu của người tiêu dùng lại khá mạnh vì nhiều người thích trò chuyện với ChatGPT. Thế nhưng, việc người dùng chi tiêu cho AI sẽ không đủ để biện minh cho toàn bộ số tiền các hãng đang đổ vào các trung tâm dữ liệu AI”, nhà báo kinh tế Noah Smith nhận xét.

"Chuyên gia thực thụ ở trình độ tiến sĩ"

OpenAI đang nhấn mạnh sức mạnh phục vụ doanh nghiệp của GPT-5. Không chỉ hỗ trợ phát triển phần mềm, GPT-5 còn xuất sắc trong viết lách, trả lời các câu hỏi liên quan đến sức khỏe và tài chính, theo OpenAI.

“Với GPT-5, lần đầu tiên tôi cảm thấy một trong các mô hình chủ lực của chúng tôi có thể được coi là chuyên gia thực thụ ở trình độ tiến sĩ trong bất kỳ lĩnh vực nào. Một trong những điều thú vị nhất mà nó có thể làm là viết cho bạn phần mềm chất lượng ngay lập tức. Ý tưởng về phần mềm theo yêu cầu sẽ là một trong những đặc điểm định hình kỷ nguyên GPT-5”, Sam Altman (Giám đốc điều hành OpenAI) nói tại một buổi họp báo.

Trong các buổi trình diễn rạng sáng 8.8, OpenAI đã cho thấy cách GPT-5 có thể được dùng để tạo ra toàn bộ phần mềm hoạt động hoàn chỉnh dựa trên các yêu cầu văn bản, thường được gọi là vibe coding (lập trình dựa trên cảm hứng với AI).

Thiếu khả năng tự học

Một thước đo thành công quan trọng là liệu bước nhảy từ GPT-4 lên GPT-5 có tương xứng với những cải tiến trước đây của OpenAI hay không. Hai người đánh giá sớm nói với Reuters rằng, dù GPT-5 gây ấn tượng với khả năng lập trình và giải các bài toán khoa học lẫn toán học, nhưng bước tiến từ GPT-4 lên GPT-5 không lớn bằng những cải tiến trước đó của OpenAI, từ GPT-3 lên GPT-4.

Ngay cả khi cải tiến đáng kể, GPT-5 vẫn chưa đủ tiên tiến để thay thế hoàn toàn con người. Sam Altman nói rằng GPT-5 vẫn thiếu khả năng tự học - yếu tố then chốt để AI có thể đạt năng lực ngang bằng con người, hay AI tổng quát (AGI).

Sam Altman: GPT-5 vẫn thiếu khả năng tự học - Ảnh: Internet

Sam Altman: GPT-5 vẫn thiếu khả năng tự học - Ảnh: Internet

Trong podcast AI nổi tiếng của mình, Dwarkesh Patel so sánh AI hiện tại với việc dạy một đứa trẻ chơi kèn saxophone chỉ bằng cách đọc lại nốt nhạc từ học sinh trước đó: “Một học sinh chơi thử một lần. Ngay khi học sinh này mắc lỗi, bạn cho em ấy nghỉ và viết hướng dẫn chi tiết về những gì đã sai. Học sinh tiếp theo đọc ghi chú của bạn và thử chơi tác phẩm của Charlie Parker (nghệ sĩ saxophone alto và nhà soạn nhạc jazz nổi tiếng người Mỹ - PV) mà không luyện trước. Khi em này thất bại, bạn lại chỉnh sửa hướng dẫn cho học sinh tiếp theo. Cách này sẽ chẳng bao giờ hiệu quả”.

Dwarkesh Patel là người dẫn chương trình kiêm tác giả Dwarkesh Podcast, nổi bật với các cuộc phỏng vấn được nghiên cứu sâu rộng. Anh chỉ mới khoảng 23 tuổi nhưng đã nhanh chóng trở thành một trong những giọng nói có ảnh hưởng trong lĩnh vực AI và khoa học nhận thức.

Tính toán lúc kiểm thử

Gần ba năm trước, ChatGPT đã giới thiệu AI tạo sinh đến với thế giới, gây choáng ngợp người dùng với khả năng viết văn và thơ giống con người, nhanh chóng trở thành một trong những ứng dụng phát triển nhanh nhất lịch sử.

Tháng 3.2023, OpenAI ra mắt GPT-4, mô hình ngôn ngữ lớn đạt bước nhảy vọt về trí tuệ. Trong khi phiên bản trước đó GPT-3.5 chỉ đạt điểm thi luật sư ở nhóm 10% thấp nhất, GPT-4 lại vượt qua kỳ thi mô phỏng này ở nhóm 10% cao nhất.

Bước tiến của GPT-4 đạt được nhờ sức mạnh điện toán và dữ liệu tăng lên đáng kể. OpenAI từng kỳ vọng rằng việc mở rộng quy mô theo cách tương tự sẽ tiếp tục tạo ra các mô hình AI ngày càng tốt hơn.

Tuy nhiên, công ty khởi nghiệp AI hàng đầu thế giới đã gặp khó khăn trong mở rộng quy mô. Một trong những vấn đề là rào cản dữ liệu mà OpenAI gặp phải. Ilya Sutskever, đồng sáng lập và cựu nhà khoa học trưởng của OpenAI, cho biết năm ngoái rằng trong khi sức mạnh xử lý đang tăng lên, lượng dữ liệu không tăng tương ứng.

Ông đề cập đến thực tế rằng mô hình ngôn ngữ lớn được huấn luyện trên các tập dữ liệu khổng lồ thu thập từ toàn bộ internet. Các phòng thí nghiệm AI hiện không còn nhiều lựa chọn khác cho kho dữ liệu văn bản do con người tạo ra.

Ngoài việc thiếu dữ liệu, một vấn đề khác là quá trình đào tạo các mô hình ngôn ngữ lớn có nhiều khả năng gặp phải lỗi do phần cứng gây ra vì hệ thống rất phức tạp. Các nhà nghiên cứu có thể không biết hiệu suất cuối cùng của mô hình ngôn ngữ lớn cho đến khi quá trình này kết thúc (có thể mất hàng tháng).

Cùng lúc đó, OpenAI khám phá ra một hướng tiếp cận khác để làm AI thông minh hơn gọi là “tính toán lúc kiểm thử”, cho phép dồn nhiều sức mạnh xử lý hơn để giải quyết từng nhiệm vụ khó như toán học hoặc tác vụ phức tạp đòi hỏi khả năng suy luận và ra quyết định nâng cao giống con người.

Tính toán lúc kiểm thử là đề cập đến việc sử dụng thêm sức mạnh điện toán để cải thiện hiệu suất của mô hình AI sau khi nó đã được huấn luyện xong.

Thay vì chỉ dựa vào kiến thức đã học trong quá trình huấn luyện, tính toán lúc kiểm thử cho phép mô hình dành thêm thời gian và tài nguyên để "suy nghĩ" khi xử lý một yêu cầu. Điều này giúp mô hình giải quyết các vấn đề phức tạp, đòi hỏi nhiều bước tư duy logic, tốt hơn.

GPT-5 hoạt động như một “bộ định tuyến”. Nếu người dùng đưa ra một câu hỏi đặc biệt khó, GPT-5 sẽ sử dụng tính toán lúc kiểm thử để trả lời.

Đây là lần đầu tiên công chúng có quyền truy cập công nghệ tính toán lúc kiểm thử của OpenAI – điều mà Sam Altman cho là quan trọng với sứ mệnh xây dựng AI vì lợi ích của toàn nhân loại.

Giám đốc điều hành OpenAI tin rằng khoản đầu tư hiện tại cho AI vẫn chưa đủ: “Chúng ta cần xây dựng nhiều cơ sở hạ tầng hơn trên toàn cầu để AI có thể được triển khai tại chỗ ở tất cả thị trường này”.

Hiện GPT‑5 là mô hình ngôn ngữ lớn mặc định mới trong ChatGPT, thay thế GPT‑4o, OpenAI o3, OpenAI o4-mini, GPT‑4.1 và GPT‑4.5 khi người dùng đăng nhập tài khoản.

Những cải tiến đánh giá của GPT-5

GPT-5 thông minh hơn rất nhiều trên mọi phương diện, thể hiện qua hiệu suất trên các bộ đánh giá học thuật và đánh giá bởi con người, đặc biệt là trong toán học, lập trình, nhận thức thị giác và y tế. Mô hình mới này thiết lập tiêu chuẩn mới ở các lĩnh vực: Toán học (94,6% trên AIME 2025 mà không dùng công cụ hỗ trợ bên ngoài), lập trình thực tế (74,9% trên SWE-bench Verified, 88% trên Aider Polyglot), hiểu đa phương thức (84,2% trên MMMU) và y tế (46,2% trên HealthBench Hard).

Mô hình ngôn ngữ lớn mới này vượt trội trên nhiều bộ đánh giá đa phương thức, gồm suy luận về hình ảnh, video, không gian và khoa học. Khả năng đa phương thức mạnh hơn của GPT-5 đồng nghĩa với việc ChatGPT có thể suy luận chính xác hơn trên hình ảnh và các đầu vào phi văn bản khác - dù đó là diễn giải một biểu đồ, tóm tắt ảnh chụp một bài thuyết trình hay trả lời câu hỏi về một sơ đồ.

Ngoài ra, GPT-5 cũng là mô hình có hiệu suất tốt nhất của OpenAI trên bộ đánh giá nội bộ, đo lường khả năng thực hiện các công việc tri thức phức tạp, có giá trị kinh tế. Ở chế độ suy luận, GPT-5 đạt kết quả tương đương hoặc vượt chuyên gia trong khoảng một nửa số trường hợp, đồng thời vượt trội so với o3 và ChatGPT Agent ở các nhiệm vụ thuộc hơn 40 ngành nghề, gồm cả luật, hậu cần, bán hàng và kỹ thuật.

Điều đáng nói là GPT-5 khai thác được nhiều giá trị hơn dù dành ít thời gian suy luận hơn. Trong các bài đánh giá của OpenAI, GPT-5 (ở chế độ suy luận) đạt hiệu suất tốt hơn o3 với lượng token đầu ra ít hơn 50-80% trên nhiều năng lực, gồm suy luận bằng hình ảnh, viết mã có tính chủ động và giải quyết các bài toán khoa học ở trình độ sau đại học.

Token đầu ra là số lượng đơn vị văn bản mà mô hình AI tạo ra trong phần trả lời.

Cuối cùng, GPT-5 ít gây ảo giác (trả lời sai giống như thật) hơn đáng kể so với các mô hình trước đây của OpenAI. Khi bật tìm kiếm web trên các lời nhắc đã được ẩn danh, đại diện cho lưu lượng truy cập thực tế vào ChatGPT, câu trả lời của GPT-5 ít có khả năng chứa lỗi thông tin hơn khoảng 45% so với GPT-4o. Ở chế độ suy luận, câu trả lời của GPT-5 ít có khả năng chứa lỗi thông tin hơn khoảng 80% so với o3.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/ceo-openai-gpt-5-co-trinh-do-tien-si-nhung-van-thieu-kha-nang-tu-hoc-235928.html