Giám đốc AI của Meta: Mô hình ngôn ngữ lớn sẽ lỗi thời trong 5 năm
'Các mô hình ngôn ngữ lớn (LLM) sẽ trở nên lỗi thời trong 5 năm tới. Nếu muốn đưa AI tiến gần đến cấp độ con người, chúng ta phải nghiên cứu mô hình vượt qua những điều mà LLM đang làm được'...

Ông Yann LeCun hiện là giáo sư tại Trung tâm Nghiên cứu Toán học Courant (Đại học New York) và là chủ nhân của Giải thưởng Turing năm 2018 - được ví như “Nobel của ngành khoa học máy tính”.
Ông Yann LeCun, Giám đốc khoa học AI của Meta và là một trong những học giả hàng đầu thế giới trong lĩnh vực trí tuệ nhân tạo, tại Hội nghị chuyên đề quốc tế về Biên giới AI 2025, tuyên bố tại diễn ra tại Hàn Quốc mới đây.
Ông Yann LeCun nhấn mạnh để đạt đến trí thông minh như con người, AI cần có thêm những bước tiến mang tính đột phá.
Ông hiện là giáo sư tại Trung tâm Nghiên cứu Toán học Courant (Đại học New York) và là chủ nhân của Giải thưởng Turing năm 2018 - được ví như “Nobel của ngành khoa học máy tính”. Ông cũng đồng thời làm giám đốc Phòng thí nghiệm Biên giới AI Toàn cầu, trung tâm nghiên cứu chung giữa Mỹ và Hàn Quốc ra mắt vào tháng 9 năm ngoái.
Trong bài phát biểu với chủ đề “Học tập theo mô hình thế giới”, Yann LeCun đã giới thiệu một hướng phát triển mới cho AI, gọi là mô hình thế giới (world model). Đây là công nghệ giúp AI hiểu được các quy luật vận hành của thế giới thực, từ đó dự đoán và chuẩn bị cho những tình huống sắp xảy ra giống như cách con người suy nghĩ và hành động.
Khác với mô hình LLM chỉ học từ văn bản và tạo ra câu chữ, mô hình thế giới học từ các tín hiệu cảm giác như hình ảnh, chuyển động và âm thanh trong môi trường thực để đưa ra dự đoán. Những “ông lớn” như Meta, OpenAI hay Google đều đang theo đuổi hướng đi này nhằm vượt qua giới hạn của LLM.
Ông Yann LeCun nhận định: “Chúng ta cần những hệ thống có thể xử lý các chuỗi hành động phức tạp, lập luận logic qua nhiều bước, và quan trọng nhất là có khả năng tự kiểm soát, hoạt động an toàn. Kiến trúc AI hiện nay về cơ bản thiếu hoàn toàn hoặc chỉ đáp ứng ở mức rất hạn chế những yếu tố đó”.
Theo ông, chỉ dựa vào văn bản là không đủ để tạo ra trí tuệ nhân tạo cấp độ con người. AI phải có khả năng hiểu và học từ thế giới vật chất thông qua các giác quan nhân tạo, đặc biệt là hình ảnh và video, để có thể suy nghĩ và hành động như con người thật sự.
Để hướng đến điều đó, ông Yann LeCun đề xuất JEPA (Joint Embedding Predictive Architecture – Kiến trúc dự đoán nhúng chung) như một mô hình thế giới mới thay thế cho LLM. JEPA không hoạt động theo kiểu “tạo sinh” (generative) mà tập trung vào khả năng hiểu và dự đoán thế giới từ dữ liệu hình ảnh, video.
“Khi các kiến trúc kiểu JEPA được áp dụng rộng rãi, chúng ta sẽ chứng kiến một cuộc chuyển đổi từ suy luận sang tối ưu hóa. Đây là nền tảng cho AI thật sự hiểu và tương tác với thế giới”, Giám đốc khoa học AI của Meta nhấn mạnh.











