OpenAI ra mắt 2 mô hình suy luận trọng số mở 'tốt và hữu dụng nhất'

06/8/2025 Gốc

OpenAI vừa phát hành hai mô hình trọng số mở có khả năng vượt trội trong suy luận nâng cao và được tối ưu hóa để chạy trên laptop.

Sam Altman, Giám đốc điều hành OpenAI, vừa công bố GPT-oss, dòng mô hình trọng số mở mà theo ông có thể hoạt động cục bộ trên laptop cao cấp và smartphone.

"Chúng tôi tin rằng đây là mô hình mở tốt nhất và hữu dụng nhất trên thế giới", Sam Altman đã viết trên mạng xã hội X.

Có hai mô hình trọng số mở khác nhau là gpt-oss-120b và gpt-oss-20b. Mô hình nhỏ hơn, gpt-oss-20b, được thiết kế để chạy trên "hầu hết máy tính để bàn (desktop) và máy tính xách tay (laptop)", trong khi mô hình lớn hơn là gpt-oss-120b hướng đến các thiết bị cao cấp hơn.

Theo OpenAI, gpt-oss-120b có thể chạy trên một GPU (bộ xử lý đồ họa) duy nhất, còn gpt-oss-20b đủ nhỏ để chạy trực tiếp trên máy tính cá nhân (PC).

“Cha đẻ ChatGPT” cho biết gpt-oss-120b và gpt-oss-20b có hiệu năng tương đương mô hình suy luận độc quyền o3-mini và o4-mini, vượt trội về khả năng lập trình, giải toán thi đấu và các truy vấn liên quan đến y tế.

Sam Altman cho biết GPT-oss có "hiệu năng thực tế mạnh mẽ tương đương với o4-mini" - mô hình suy luận độc quyền cỡ nhỏ của OpenAI.

OpenAI ra mắt 2 mô hình suy luận trọng số mở ‘tốt và hữu dụng nhất’, chạy trên laptop

Theo OpenAI, gpt-oss-120b và gpt-oss-20b được huấn luyện trên tập dữ liệu chỉ gồm văn bản, ngoài kiến thức tổng quát thì còn tập trung vào khoa học, toán học và lập trình. OpenAI không công bố bảng so sánh hiệu năng gpt-oss-120b và gpt-oss-20b so với các đối thủ như DeepSeek-R1.

Thông báo hôm 5.8 không phải là GPT-5, mô hình ngôn ngữ lớn đã được đồn đoán từ lâu và dự kiến ra mắt trong tuần này. Thay vào đó, đây là hai mô hình trọng số mở đầu tiên mà OpenAI phát hành kể từ GPT-2 vào năm 2019.

“Là một phần trong nỗ lực đó, chúng tôi kỳ vọng rằng đợt phát hành này sẽ mở ra những hướng nghiên cứu mới và tạo ra những loại sản phẩm mới. Chúng tôi dự đoán tốc độ đổi mới trong lĩnh vực của mình sẽ tăng đáng kể và sẽ có nhiều người hơn thực hiện những công việc quan trọng so với trước đây”, Giám đốc điều hành OpenAI viết.

Các thông số hoặc trọng số đã được huấn luyện trong mô hình ngôn ngữ trọng số mở là công khai, cho phép nhà phát triển tải xuống công khai, sử dụng để phân tích và tinh chỉnh mô hình cho các tác vụ cụ thể mà không cần dữ liệu huấn luyện gốc.

Greg Brockman, đồng sáng lập kiêm Chủ tịch OpenAI, cho biết trong một cuộc họp báo: "Một trong những điều độc đáo về các mô hình trọng số mở là mọi người có thể chạy chúng cục bộ. Mọi người có thể chạy chúng đằng sau tường lửa và trên cơ sở hạ tầng của chính họ".

Mô hình ngôn ngữ trọng số mở khác với mô hình mã nguồn mở, vốn cho phép truy cập toàn bộ mã nguồn, dữ liệu huấn luyện và phương pháp huấn luyện.

Trước đó, Sam Altman đã từng báo hiệu rằng OpenAI sẽ quay lại phát hành ít nhất một số mô hình mở: “Chúng tôi sẽ tạo ra một mô hình mã nguồn mở rất mạnh mẽ và tốt hơn bất kỳ mô hình nào hiện có”.

OpenAI được kỳ vọng sẽ ra mắt GPT-5 vào tháng 8 này. Đây có thể sẽ là mô hình AI mạnh mẽ nhất thế giới.

Trong một tập mới đây của podcast This Past Weekend with Theo Von, Sam Altman mô tả trải nghiệm thử nghiệm GPT-5 với giọng điệu căng thẳng.

Sam Altman nói rằng GPT-5 “hoạt động rất nhanh” khi kể lại những khoảnh khắc khiến ông cảm thấy rất lo sợ. Dù thúc đẩy việc phát triển GPT-5, doanh nhân 40 tuổi người Mỹ tuyên bố rằng trong một số phiên thử nghiệm, ông đã nhìn vào GPT-5 và so sánh mô hình AI thế hệ mới này với dự án Manhattan.

Manhattan là dự án nghiên cứu và phát triển tuyệt mật được Mỹ tiến hành trong Thế chiến II, với sự hỗ trợ của Anh và Canada. Mục tiêu chính của dự án là chế tạo bom nguyên tử đầu tiên trước khi Đức Quốc xã có thể kịp phát triển loại vũ khí này.

Dự án kéo dài từ năm 1942 đến 1946, quy tụ hàng ngàn nhà khoa học, kỹ sư và công nhân tại hơn 30 địa điểm khác nhau trên khắp Mỹ, Anh và Canada. Đây là một nỗ lực khoa học và công nghiệp khổng lồ, đòi hỏi sự phối hợp chặt chẽ giữa quân đội, khoa học và công nghiệp.

Hồi tháng 3, OpenAI đã huy động tới 40 tỉ USD trong vòng gọi vốn mới do SoftBank Group dẫn đầu, định giá công ty đến 300 tỉ USD.

Có trên Bedrock

Ở một diễn biến khác, Amazon thông báo rằng hai mô hình trọng số mở của OpenAI hiện đã có mặt trên nền tảng thị trường AI tạo sinh Bedrock thuộc Amazon Web Services. Đây là lần đầu tiên một mô hình của OpenAI xuất hiện trên Bedrock, theo Atul Deo - Giám đốc sản phẩm của Bedrock.

“OpenAI đã phát triển những mô hình tuyệt vời và chúng tôi tin rằng đây sẽ là những lựa chọn mã nguồn mở hoặc trọng số mở tuyệt vời cho khách hàng”, Atul Deo nói trong một cuộc phỏng vấn. Ông từ chối tiết lộ các thỏa thuận hợp đồng giữa Amazon Web Services và OpenAI. Amazon Web Services là nhà cung dịch vụ điện toán đám mây hàng đầu thế giới.

Cổ phiếu Amazon đã giảm mạnh vào tuần trước sau khi công ty báo cáo tăng trưởng chậm lại ở mảng Amazon Web Services, đặc biệt là khi so với các đối thủ.

Cuộc cạnh tranh giữa các mô hình AI mã nguồn mở năm nay đang rất gay gắt. Trong một thời gian, các mô hình Llama của Meta Platforms được coi là tốt nhất, nhưng điều đó thay đổi vào đầu năm nay khi công ty khởi nghiệp DeepSeek (Trung Quốc) tung ra mô hình suy luận R1 mạnh mẽ và được đào tạo với chi phí thấp.

Dòng mô hình Llama 4 ra mắt hồi tháng 4 gây thất vọng khiến Meta Platforms bạo chi, đưa ra các gói lương thưởng khổng lồ để chiêu mộ thành công nhiều chuyên gia AI hàng đầu khắp Thung lũng Silicon, từ cả Apple, OpenAI, Google và Anthropic, cho bộ phận Superintelligence Labs.

Giám đốc điều hành Mark Zuckerberg cho biết Meta Platforms sẽ khác biệt so với các công ty AI khác vì đặt mục tiêu mang lại “siêu trí tuệ cá nhân cho mọi người” – trọng tâm của Superintelligence Labs.

Mark Zuckerberg cho biết Meta sẽ không tập trung vào mô hình AI mã nguồn mở nữa khi DeepSeek và các công ty Trung Quốc đang dẫn đầu lĩnh vực này - Ảnh: Internet

Những quan điểm mới nhất của Mark Zuckerberg về AI đánh dấu bước lùi so với một năm trước, khi ông đăng bài luận có tiêu đề “AI mã nguồn mở là con đường phía trước”.

Meta Platforms, công ty từng ủng hộ mạnh mẽ AI mã nguồn mở thông qua dòng mô hình Llama, nay cho biết sẽ thận trọng hơn khi đi theo con đường này. Điều đó trái ngược với xu hướng tiếp nhận mạnh mẽ ở Trung Quốc với mô hình AI mã nguồn mở.

Mark Zuckerberg cho biết công ty sẽ trở nên ít công khai mã nguồn hơn so với trước đây, viện dẫn lý do lo ngại về bảo mật khi công nghệ AI đang phát triển nhanh chóng.

“Chúng ta sẽ cần phải nghiêm ngặt trong việc giảm thiểu các rủi ro liên quan đến an toàn AI và thận trọng lựa chọn những gì sẽ công khai mã nguồn”, tỷ phú 40 tuổi người Mỹ viết trong một bài đăng trên trang web của Meta Platforms.

Theo bảng xếp hạng trên Hugging Face (nền tảng AI mã nguồn mở lớn nhất thế giới), 8 trong số 10 mô hình phổ biến nhất được phát triển bởi các công ty Trung Quốc, gồm cả startup như Zhipu AI và Moonshot AI cũng như hãng công nghệ lớn như Tencent Holdings và Alibaba.

Jeffrey Ding, trợ lý giáo sư ngành Khoa học Chính trị tại Đại học George Washington (Mỹ), nhận xét rằng tuyên bố này của Mark Zuckerberg “sẽ có ý nghĩa hơn nếu được đưa ra vào thời điểm các mô hình mã nguồn mở Llama còn đang dẫn đầu thay vì hiện tại, khi chúng đã tụt lại phía sau so với trình độ tiên tiến nhất”.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/openai-ra-mat-2-mo-hinh-suy-luan-trong-so-mo-tot-va-huu-dung-nhat-235816.html