Meta muốn lật đổ OpenAI khi tổ chức LlamaCon, Mark Zuckerberg xem DeepSeek và Alibaba là đồng minh
Hôm 29.4, Meta Platforms đã tổ chức LlamaCon, hội nghị đầu tiên của mình dành cho các nhà phát triển trí tuệ nhân tạo (AI), trong trụ sở công ty ở thành phố Menlo Park, bang California, Mỹ.
Công ty mẹ Facebook thông báo ra mắt ứng dụng chatbot Meta AI dành cho người tiêu dùng, đối thủ cạnh tranh với ChatGPT, cũng như API cho nhà phát triển để truy cập các mô hình Llama trên nền tảng đám mây.
API (Application Programming Interface) là giao diện lập trình ứng dụng. Nói một cách đơn giản, API là tập hợp các quy tắc cho phép các phần mềm hoặc hệ thống khác nhau giao tiếp với nhau. Nó giống một cửa sổ hoặc cổng mà qua đó ứng dụng có thể "nói chuyện" với ứng dụng khác mà không cần biết nội bộ bên trong hoạt động ra sao.
Cả hai sản phẩm này đều nhằm thúc đẩy việc ứng dụng rộng rãi các mô hình AI mã nguồn mở Llama, nhưng mục tiêu đó có thể chỉ là thứ yếu so với động cơ thực sự của Meta Platforms: Đánh bại OpenAI. Về tổng thể, tham vọng AI của Meta Platforms là thúc đẩy hệ sinh thái AI mã nguồn mở phát triển mạnh, nhằm chống lại các AI "đóng" như OpenAI - vốn khóa chặt mô hình của họ sau các dịch vụ thương mại.
Ứng dụng chatbot Meta AI gần như là một nước đi phủ đầu của Meta Platforms trước tin đồn OpenAI sẽ ra mắt mạng xã hội riêng. Chatbot này có một nguồn cấp dữ liệu xã hội, nơi người dùng có thể chia sẻ các đoạn hội thoại với AI, và cung cấp phản hồi được cá nhân hóa dựa trên hoạt động của mình trên các ứng dụng Meta Platforms.
Về phần API Llama, đó là thách thức trực tiếp đến mảng kinh doanh API của OpenAI. API Llama được thiết kế để giúp các nhà phát triển dễ dàng xây dựng ứng dụng kết nối với các mô hình Llama trên nền tảng đám mây, chỉ bằng một dòng mã. Điều này loại bỏ nhu cầu phụ thuộc vào các nhà cung cấp đám mây bên thứ ba để vận hành mô hình Llama và giúp Meta Platforms cung cấp bộ công cụ đầy đủ hơn cho các nhà phát triển AI.
Giống nhiều công ty AI khác, Meta Platforms xem OpenAI là đối thủ hàng đầu. Các tài liệu tòa án trong vụ kiện của Ủy ban Thương mại Liên bang Mỹ (FTC) chống lại Meta Platforms cho thấy các lãnh đạo công ty này từng bị ám ảnh với việc vượt GPT-4, mô hình AI của OpenAI từng được coi là tiên tiến nhất cách đây 2 năm.
Việc lật đổ các nhà cung cấp mô hình độc quyền như OpenAI từ lâu đã là cốt lõi trong chiến lược AI của Meta Platforms. Trong một bức thư vào tháng 7.2024, Giám đốc điều hành Mark Zuckerberg đã cố gắng phân biệt Meta Platforms với các công ty như OpenAI, khi viết rằng “việc bán quyền truy cập các mô hình AI không phải là cách kinh doanh của họ”.
Trước thềm LlamaCon, một số nhà nghiên cứu AI chia sẻ với trang TechCrunch rằng họ hy vọng Meta Platforms sẽ ra mắt mô hình suy luận như o3-mini của OpenAI. Tuy nhiên, công ty đã không làm điều đó. Với Meta Platforms, không nhất thiết phải chiến thắng trong cuộc đua AI.
Ở cuộc trò chuyện trên sân khấu cùng Ali Ghodsi (Giám đốc điều hành Databricks) tại LlamaCon, Mark Zuckerberg nói rằng ông xem bất kỳ phòng nghiên cứu AI nào công khai mã nguồn mô hình của mình, gồm cả DeepSeek và Qwen của Alibaba, là đồng minh trong cuộc chiến chống lại các nhà cung cấp mô hình đóng.
Databricks là công ty phần mềm doanh nghiệp cung cấp nền tảng dựa trên đám cho dữ liệu, phân tích và AI.
“Một phần giá trị của mã nguồn mở là bạn có thể kết hợp linh hoạt các phần tốt nhất từ nhiều mô hình AI khác nhau. Vì vậy, nếu một mô hình khác như DeepSeek tốt hơn, hoặc nếu Qwen giỏi hơn ở một khía cạnh nào đó, thì với tư cách là nhà phát triển, bạn có khả năng lấy những phần tốt nhất từ nhiều mô hình và tạo ra chính xác những gì mình cần. Đây là một phần lý do tại sao tôi tin rằng mã nguồn mở rồi sẽ vượt mặt các mô hình đóng về chất lượng… Có cảm giác như đây là một lực lượng không thể ngăn cản”, Giám đốc điều hành Meta Platforms phát biểu.

Tại LlamaCon, Mark Zuckerberg nói rằng ông xem DeepSeek và Qwen của Alibaba là đồng minh trong cuộc chiến chống lại các nhà cung cấp mô hình đóng như OpenAI - Ảnh: Getty Images
Vượt ra ngoài mục tiêu kìm hãm OpenAI phát triển, Meta Platforms cũng có thể đang thúc đẩy các mô hình AI nguồn mở của mình để đáp ứng một điều khoản trong quy định pháp lý ở Liên minh châu Âu (EU). Đạo luật AI của EU trao những quyền lợi đặc biệt cho các công ty phân phối hệ thống AI “miễn phí và mã nguồn mở”. Meta Platforms thường tuyên bố rằng các mô hình Llama của họ là “mã nguồn mở”, dù vẫn còn tranh cãi về việc liệu chúng có đáp ứng đủ tiêu chí hay không.
Dù với lý do gì, Meta Platforms dường như hài lòng với việc cho ra mắt các sản phẩm AI nhằm củng cố hệ sinh thái mô hình mở và hạn chế sự phát triển của OpenAI, thậm chí phải đánh đổi bằng việc không cung cấp các mô hình AI tiên tiến.
Phiên bản Llama 4 Maverick chưa tinh chỉnh của Meta Platforms xếp hạng thấp hơn nhiều mô hình AI phổ biến
Đầu tháng 4, Meta Platforms đã gặp rắc rối khi sử dụng một phiên bản thử nghiệm, chưa phát hành của mô hình Llama 4 Maverick để đạt điểm cao và đứng vị trí thứ hai trên bảng xếp hạng LM Arena.
LM Arena là trang đánh giá điểm chuẩn AI mà con người so sánh kết quả đầu ra từ các hệ thống khác nhau và bỏ phiếu cho mô hình tốt nhất.
Sự việc đó đã khiến những người quản lý LM Arena phải xin lỗi, thay đổi chính sách và chấm điểm lại phiên bản Llama 4 Maverick gốc chưa được tinh chỉnh. Hóa ra, phiên bản này lại không có tính cạnh tranh cao.
Phiên bản Llama 4 Maverick chưa chỉnh sửa, với tên gọi Llama-4-Maverick-17B-128E-Instruct, bị xếp hạng dưới nhiều mô hình AI phổ biến khác trên LM Arena như GPT-4o của OpenAI, Claude 3.5 Sonnet của Anthropic và Google Gemini 1.5 Pro, thay vì vị trí thứ hai. Nhiều trong số đó đã ra mắt từ vài tháng trước.

Tài khoản X Pigeon mỉa mai Meta Platforms: “Phiên bản Llama-4-Maverick-17B-128E-Instruct đã được thêm vào LMArena sau khi phát hiện Meta gian lận, nhưng có lẽ bạn không thấy nó vì phải cuộn xuống tận vị trí thứ 32”.
Vì sao Llama-4-Maverick-17B-128E-Instruct lại bị xếp hạng thấp như vậy? Phiên bản thử nghiệm Llama-4-Maverick-03-26-Experimental của Meta Platforms được “tối ưu cho hội thoại”, theo giải thích từ công ty trong một biểu đồ được công bố hôm 5.4. Việc tối ưu hóa đó rõ ràng đã phát huy tác dụng tốt trên LM Arena, nơi những người đánh giá so sánh kết quả đầu ra của các mô hình AI và chọn ra kết quả mà họ ưa thích hơn.
Theo trang Tech Crunch, vì nhiều lý do, LM Arena chưa bao giờ là thước đo đáng tin cậy nhất về hiệu suất của một mô hình AI. Tuy nhiên, việc tùy chỉnh mô hình AI để phù hợp với một bảng xếp hạng cụ thể, ngoài việc dễ gây hiểu nhầm thì còn khiến các nhà phát triển gặp khó khăn để dự đoán chính xác hiệu suất của mô hình trong các bối cảnh khác nhau.
Trong một tuyên bố, Ashley Gabriel, người phát ngôn của Meta Platforms, cho biết: “Chúng tôi thường xuyên thử nghiệm nhiều biến thể tùy chỉnh khác nhau của mô hình. Llama-4-Maverick-03-26-Experimental là phiên bản tối ưu hóa cho hội thoại mà chúng tôi đã thử nghiệm và đạt kết quả tốt trên LMArena. Chúng tôi hiện phát hành phiên bản mã nguồn mở và sẽ xem cách các nhà phát triển tùy chỉnh Llama 4 cho các trường hợp sử dụng riêng của họ. Chúng tôi rất mong đợi những gì họ sẽ xây dựng và luôn hoan nghênh phản hồi từ cộng đồng”.
Hôm 5.4, Meta Platforms đã ra mắt dòng mô hình AI mới Llama 4 với ba phiên bản là Llama 4 Scout, Llama 4 Maverick và Llama 4 Behemoth. Trong đó, Llama 4 Scout và Llama 4 Maverick là mô hình trọng số mở.
Mô hình trọng số mở nằm giữa mã nguồn mở và mô hình độc quyền, nghĩa là chia sẻ các tham số đã được huấn luyện trước nhưng giữ bí mật một số chi tiết phát triển quan trọng. Điều này cho phép các nhà phát triển tinh chỉnh và triển khai mô hình mà không cần dữ liệu huấn luyện gốc hoặc truy cập kiến trúc bên trong.
Meta Platforms đang giới thiệu bản xem trước của Llama 4 Behemoth, được gọi là "một trong những mô hình ngôn ngữ lớn thông minh nhất thế giới và là mô hình mạnh mẽ nhất của chúng tôi, đóng vai trò một giáo viên cho các mô hình mới".
Thời điểm đó, công ty tuyên bố mô hình nhỏ Llama 4 Scout và mô hình tầm trung Llama 4 Maverick có thể vượt qua GPT-4o và Gemini 2.0 Flash "trong nhiều bài kiểm tra điểm chuẩn phổ biến".
Trong thông cáo báo chí, Meta Platforms đã nhấn mạnh điểm ELO của Maverick là 1417, vượt qua GPT-4o của OpenAI và chỉ đứng sau Gemini 2.5 Pro. Điểm ELO cao hơn nghĩa là mô hình chiến thắng thường xuyên hơn khi đối đầu trực tiếp với các đối thủ.
Thành tích này dường như giúp mô hình mã nguồn mở Llama 4 trở thành đối thủ đáng gờm với các mô hình nguồn đóng mạnh mẽ đến từ OpenAI, Anthropic và Google. Song sau đó, các nhà nghiên cứu AI đã phát hiện ra điều bất thường khi xem kỹ tài liệu của Meta Platforms.
Trong phần chữ nhỏ, Meta Platforms thừa nhận rằng phiên bản Llama 4 Maverick được dùng để kiểm tra trên LMArena không giống phiên bản công khai. Theo tài liệu của chính Meta Platforms, công ty đã sử dụng một phiên bản “trò chuyện thử nghiệm” của Llama 4 Maverick trên LMArena, được “tối ưu hóa đặc biệt cho hội thoại”, theo TechCrunch.
“Cách diễn giải chính sách của Meta không khớp với những gì chúng tôi mong đợi từ các nhà cung cấp mô hình. Meta lẽ ra nên nói rõ rằng Llama-4-Maverick-03-26-Experimental là một mô hình tùy chỉnh được tối ưu cho sở thích của con người. Vì vậy, chúng tôi đang cập nhật chính sách bảng xếp hạng của mình để củng cố cam kết về việc đánh giá công bằng, người khác có thể kiểm chứng, tránh gây hiểu nhầm trong tương lai”, LMArena đăng trên mạng xã hội X hai ngày sau khi Llama 4 được phát hành.
Khi các công ty có thể gửi những phiên bản mô hình AI được điều chỉnh đặc biệt để kiểm tra nhưng lại công bố phiên bản khác cho công chúng, các bảng xếp hạng như LMArena trở nên kém ý nghĩa hơn khi nói đến hiệu suất thực tế.
“Đó là điểm chuẩn chung được tôn trọng rộng rãi nhất vì tất cả những điểm chuẩn khác đều tệ. Khi Llama 4 ra mắt và đứng thứ hai trên LMArena, chỉ sau Gemini 2.5 Pro, tôi thật sự rất ấn tượng. Tuy nhiên, giờ tôi hối hận vì không đọc kỹ phần chữ nhỏ”, nhà nghiên cứu AI độc lập Simon Willison nói với trang The Verge.