Meta sắp ra mắt mô hình Llama mới để theo đuổi siêu trí tuệ

Meta Platforms đang chạy đua để kịp ra mắt mô hình trí tuệ nhân tạo (AI) Llama thế hệ tiếp theo trước cuối năm nay.

Đây là một trong những dự án đầu tiên xuất phát từ đơn vị mới thành lập mang tên Meta Superintelligence Labs (MSL) – tập trung phát triển siêu trí tuệ cá nhân cho mọi người.

TBD, 1 trong 4 đội thuộc MSL, đang phát triển Llama 4.X với mục tiêu đưa mô hình AI này vào trạng thái sẵn sàng triển khai đúng thời hạn cuối năm, hai người am hiểu vấn đề tiết lộ với trang Insider. Họ yêu cầu ẩn danh vì không được phép phát ngôn với báo chí. Nguồn tin này cũng cho biết Llama 4.X còn được gọi nội bộ là Llama 4.5.

Hai mô hình Llama 4 ra mắt hồi tháng 4, gồm Scout và Maverick, nhận về phản hồi bày tỏ sự thất vọng từ một số nhà phát triển. Họ cho rằng Llama 4 chưa đáp ứng được kỳ vọng trong các tác vụ thực tế như lập trình, suy luận và làm theo hướng dẫn. Theo các nguồn tin của Insider, TBD đang cố gắng sửa lỗi và "hồi sinh" Llama 4.

Công ty mẹ Facebook từng phát triển một mô hình AI có tên Behemoth, thuộc cùng dòng Llama 4. Tuy nhiên, trang The Wall Street Journal đưa tin hồi tháng 5 rằng Meta Platforms đã hoãn kế hoạch rphát hành mô hình AI này.

Người phát ngôn Meta Platforms từ chối bình luận về Llama 4.X và dẫn lời phát biểu của Giám đốc điều hành Mark Zuckerberg trong buổi công bố kết quả kinh doanh quý 2/2025 hồi tháng 7. Khi đó, tỷ phú 40 tuổi người Mỹ cho biết công ty thành lập MSL nhằm tập trung phát triển thế hệ mô hình AI tiếp theo.

“Chúng tôi đang đạt tiến bộ tốt với Llama 4.1 và 4.2, đồng thời song song phát triển các mô hình thế hệ kế tiếp nhằm mở rộng giới hạn công nghệ trong năm tới”, Mark Zuckerberg nói.

Cuối tháng 6, Mark Zuckerberg lần đầu thông báo thành lập MSL trong một bản ghi nhớ nội bộ. Đến tháng 8, Meta Platforms đã tái tổ chức các nhóm AI thành bốn trụ cột là huấn luyện, nghiên cứu, sản phẩm và hạ tầng. Trong một bản ghi nhớ, Alexandr Wang (Giám đốc AI của Microsoft và lãnh đạo MSL) giải thích rằng TBD sẽ chịu trách nhiệm “huấn luyện và mở rộng các mô hình ngôn ngữ lớn để đạt được siêu trí tuệ”, gồm cả việc phát triển một mô hình mang tên omni. Tuy nhiên, email của Alexandr Wang không tiết lộ chi tiết về omni.

Việc ra mắt MSL diễn ra sau khi Mark Zuckerberg mở chiến dịch chiêu mộ nhân tài AI rầm rộ những tháng gần đây, sẵn sàng chi những gói lương thưởng trị giá hàng trăm triệu USD để lôi kéo các nhà nghiên cứu AI hàng đầu từ đối thủ như OpenAI, Apple, Google DeepMind, Anrthopic.

Song chưa đầy hai tháng sau khi được thành lập, MSL đã bắt đầu mất nhân sự. Ít nhất 8 nhân viên, gồm cả các nhà nghiên cứu, kỹ sư và một lãnh đạo cấp cao về sản phẩm, đã rời công ty trong vòng hai tháng qua.

Meta Platforms cố ra mắt mô hình Llama trước cuối năm nay - Ảnh: Internet

Meta Platforms cố ra mắt mô hình Llama trước cuối năm nay - Ảnh: Internet

Meta tái cấu trúc đội ngũ AI hàng tỉ USD

Hôm 19.8, Meta Platforms thông báo chia MSL thành 4 đội riêng biệt và điều chuyển nhiều chuyên gia AI hiện có. Đây là nỗ lực nhằm tận dụng tốt hơn đội ngũ nhân tài AI trị giá hàng tỉ USD mà công ty mẹ Facebook chiêu mộ gần đây.

Theo một bản ghi nhớ nội bộ được gửi hôm 19.8 từ Alexandr Wang, cơ cấu mới này nhằm thúc đẩy nỗ lực của công ty trong việc theo đuổi siêu trí tuệ, hay công nghệ AI có thể hoàn thành các nhiệm vụ thậm chí còn tốt hơn con người.

Alexandr Wang (cựu giám đốc điều hành Scale AI) viết trong bản ghi nhớ rằng: “Siêu trí tuệ đang đến gần và để tiếp cận công nghệ này một cách nghiêm túc, chúng ta cần tổ chức theo các lĩnh vực chính sẽ đóng vai trò then chốt để đạt được nó. Đó là nghiên cứu, sản phẩm và cơ sở hạ tầng”, theo hãng tin Bloomberg.

MSL giờ đây sẽ có 4 bộ phận:

TBD Labdo Alexandr Wang đứng đầu, sẽ giám sát các mô hình ngôn ngữ lớn của Meta Platforms, gồm cả bộ Llama làm nền tảng cho trợ lý Meta AI.

FAIR (Nghiên cứu AI Cơ bản) - phòng thí nghiệm nghiên cứu AI nội bộ đã tồn tại trong công ty hơn một thập kỷ, tập trung vào các dự án dài hạn hơn.

Products and Applied Research (Sản phẩm và Nghiên cứu Ứng dụng) do Nat Friedman (cựu giám đốc điều hành GitHub) lãnh đạo, sẽ lấy các mô hình và nghiên cứu để đưa vào các sản phẩm dành cho người tiêu dùng.

MSL Infra sẽ tập trung vào cơ sở hạ tầng đắt đỏ cần thiết để hỗ trợ các tham vọng về AI của Meta Platforms.

Mark Zuckerberg nói rằng mục tiêu của công ty là đạt được siêu trí tuệ. Tỷ phú 40 tuổi người Mỹ dự kiến sẽ chi hàng trăm tỉ USD cho nhân tài và cơ sở hạ tầng cần thiết để đạt được điều đó.

Từ góc độ thuần túy về số liệu, đội ngũ MSL đang sở hữu mức đãi ngộ thuộc hàng cao nhất giới doanh nghiệp, thậm chí còn hơn cả vị trí giám đốc điều hành tại các ngân hàng lớn trên thế giới. Thế nhưng, phần lớn số tiền này được gắn với các mục tiêu hiệu suất và chỉ được giải ngân trong nhiều năm gắn bó, nghĩa là những nhân tài AI mới sẽ không nhận được toàn bộ số tiền nếu rời Meta Platforms sớm hoặc nếu cổ phiếu công ty tăng trưởng không tốt.

Mark Zuckerberg (trái) trò chuyện vui vẻ cùng Alexandr Wang (giữa) và Shengjia Zhao (phải) hồi tháng 7 - Ảnh: Threads

Mark Zuckerberg (trái) trò chuyện vui vẻ cùng Alexandr Wang (giữa) và Shengjia Zhao (phải) hồi tháng 7 - Ảnh: Threads

Nhóm dẫn dắt mảng AI của Meta Platforms đã phải đối mặt với nhiều xáo trộn vài năm qua, gồm cả nhiều thay đổi chỉ riêng trong 2025 khi công ty chạy đua để theo kịp các đối thủ như OpenAI và Google. Trước khi công bố MSL vào tháng 6, gã khổng lồ mạng xã hội Mỹ có ba nhóm AI chính là FAIR, sản phẩm AI và nền tảng AGI, chuyên tập trung vào các sản phẩm và nghiên cứu AI tạo sinh.

Nhóm nền tảng AGI đang bị giải thể, với các lãnh đạo Ahmad Al-Dahle cùng Amir Frenkel đang tập trung vào các sáng kiến chiến lược của MSL và báo cáo trực tiếp cho Alexandr Wang, theo bản ghi nhớ.

Connor Hayes, cựu giám đốc nhóm sản phẩm AI, đã được điều chuyển để điều hành Threads – mạng xã hội cạnh tranh với X của Elon Musk.

Cũng trong đợt tái cơ cấu gần đây, Aparna Ramani (phó chủ tịch phụ trách lãnh đạo các đơn vị AI, dữ liệu và cơ sở hạ tầng dành cho nhà phát triển của Meta Platforms) sẽ điều hành MSL Infra, theo bản ghi nhớ.

Robert Fergus sẽ tiếp tục lãnh đạo FAIR, đơn vị mà ông đồng sáng lập vào năm 2014. Trước đó, ông đã rời Meta Platforms và làm việc tại Google DeepMind trong vài năm trước khi quay lại để điều hành FAIR vào mùa xuân này.

Loredana Crisan (từng lãnh đạo ứng dụng Messenger của Meta Platforms và chuyển sang nhóm AI tạo sinh vào tháng 2) đang rời công ty để gia nhập Figma, theo Bloomberg.

Sau khi Llama 4 gây thất vọng, Mark Zuckerberg đã lập một danh sách các ngôi sao AI để chiêu mộ cho Meta Superintelligence Labs và mời gọi thành công Shengjia Zhao (đồng tác giả ChatGPT và cựu trưởng nhóm khoa học tại OpenAI), Alexandr Wang và nhiều nhân tài khác từ OpenAI, Apple, Anthropic.

Shengjia Zhao được bổ nhiệm làm nhà khoa học trưởng Superintelligence Labs.

Không những thế, Meta Platforms thu hút ít nhất 10 nhà nghiên cứu Google DeepMind kể từ tháng 7 - con số chưa từng được công bố trước đây, theo dữ liệu LinkedIn mà trang Insider xem xét. Trong số đó có những nhà nghiên cứu từng tham gia phát triển các mô hình AI mạnh nhất của Google và đóng góp công trình giúp Google giành huy chương vàng Olympic Toán học Quốc tế.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/meta-sap-ra-mat-mo-hinh-llama-moi-de-theo-duoi-sieu-tri-tue-236846.html