AI sở hữu trực giác tiên liệu hành vi của con người
Trong thế giới của trí tuệ nhân tạo (AI), khả năng robot 'nhìn thấy' chướng ngại vật đã không còn là vấn đề, mà thách thức là tiên liệu hành vi của con người.

Con người ngày càng đòi hỏi khả năng tính toán cao hơn từ AI
Các hệ thống camera và cảm biến hiện đại có thể phát hiện một người đi bộ ở khoảng cách xa, nhưng chúng vẫn vấp phải một giới hạn mang tính bản năng: chúng chỉ phản ứng lại những chuyển động vật lý đã hoặc đang diễn ra mà thiếu đi khả năng suy luận về những gì sắp xảy ra tiếp theo.
Khoảng trống công nghệ này chính là ranh giới mong manh giữa một cỗ máy vô tri và một người lái xe có kinh nghiệm. Tuy nhiên, ranh giới đó đang dần bị xóa nhòa bởi một mô hình AI hoàn toàn mới, hứa hẹn mang lại khả năng tiên tri chưa từng có cho máy móc.
Các nhà nghiên cứu từ Đại học Texas A&M (Mỹ) và Viện Khoa học và Công nghệ Tiên tiến Hàn Quốc (KAIST) vừa giới thiệu OmniPredict, một hệ thống trí tuệ nhân tạo đột phá không chỉ dừng lại ở việc quan sát, mà còn có khả năng giải mã các tín hiệu thị giác và ngữ cảnh theo thời gian thực để dự báo hành vi con người.
Sử dụng nền tảng công nghệ Mô hình Ngôn ngữ Lớn Đa phương thức (MLLM), tương tự như bộ não phía sau các chatbot tiên tiến nhất hiện nay, OmniPredict không chỉ "thấy" người đi đường, mà còn "hiểu" được ý định của họ, mở ra một kỷ nguyên mới nơi máy móc sở hữu thứ mà chúng ta vẫn thường gọi là trực giác hay sự khôn ngoan đường phố.
Bước nhảy vọt về "trực giác máy": Từ phản ứng thụ động sang phòng vệ chủ động
Để hiểu được tầm quan trọng của OmniPredict, chúng ta cần nhìn nhận lại cách vận hành của các hệ thống xe tự lái truyền thống. Hầu hết các công nghệ hiện nay dựa vào thị giác máy tính được huấn luyện trên hàng nghìn bộ dữ liệu hình ảnh để nhận diện vật thể. Khi một người đi bộ bước xuống lòng đường, xe sẽ nhận diện chuyển động đó và phanh lại. Đó là một quy trình phản ứng thuần túy.
Ngược lại, OmniPredict bổ sung một lớp nhận thức hoàn toàn mới, đưa trí thông minh của xe tiệm cận với trực giác của con người. Thay vì chỉ đơn thuần tính toán quỹ đạo di chuyển hiện tại, hệ thống này kết hợp hình ảnh thu được với các chi tiết ngữ cảnh tinh tế, như dáng điệu ngập ngừng, hướng nhìn của mắt, hay ngôn ngữ cơ thể, để xây dựng một kịch bản về những gì người đó có khả năng làm tiếp theo.
Tiến sĩ Srinkanth Saripalli, trưởng nhóm nghiên cứu và là giám đốc Trung tâm Phương tiện Tự hành và Hệ thống Cảm biến, mô tả mô hình này như một cái nhìn thoáng qua về tương lai, nơi máy móc không chỉ là những quan sát viên thụ động. Trong môi trường đô thị hỗn loạn, nơi mà sự khó lường của người đi bộ là hằng số, khả năng "đọc vị" suy nghĩ này mang ý nghĩa sống còn.
Nếu hoạt động đúng như thiết kế, OmniPredict có thể thay đổi hoàn toàn cách các phương tiện tự hành vận hành trong các thành phố đông đúc. Xe sẽ không còn phải phanh gấp mỗi khi thấy bóng người ở lề đường, mà có thể "hiểu" rằng người đó đang đứng đợi đèn đỏ và không có ý định băng qua, từ đó duy trì dòng chảy giao thông mượt mà hơn.
Ngược lại, nó có thể phát hiện ra một người đang mải nhìn điện thoại và có xu hướng bước xuống đường một cách vô thức để chủ động giảm tốc độ từ xa. Sự chuyển dịch từ phản ứng sang chủ động ngăn chặn nguy hiểm này chính là chìa khóa để giảm thiểu các vụ tai nạn liên quan đến người đi bộ và gỡ bỏ những tình huống đối đầu căng thẳng tại các giao lộ.
Tác động của công nghệ này không chỉ dừng lại ở khía cạnh kỹ thuật an toàn mà còn thay đổi cả cảnh quan tâm lý của người tham gia giao thông. Hãy tưởng tượng cảm giác của một người đi bộ khi đứng trước vạch qua đường. Thay vì phải cố gắng giao tiếp bằng ánh mắt với tài xế để đoán định ý định nhường đường, giờ đây họ có thể yên tâm rằng chiếc xe AI đang lao tới đã theo dõi vị trí, phân tích tư thế và lên kế hoạch di chuyển dựa trên dự đoán về bước đi tiếp theo của họ.
Sự hiểu biết sâu sắc không chỉ về chuyển động (motion) mà quan trọng hơn là về động cơ (motives) của con người sẽ giúp các con phố trở nên an toàn và trôi chảy hơn, giảm bớt những pha thót tim hay những hiểu lầm tai hại giữa người và máy.
Vượt ra ngoài giao lộ: Hiệu suất vượt trội và tiềm năng trong an ninh, quốc phòng
Sức mạnh của OmniPredict không chỉ giới hạn trong việc điều tiết giao thông tại các ngã tư đô thị hay những con phố đông đúc. Khả năng đọc hiểu hành vi con người trong những môi trường phức tạp mở ra cánh cửa cho hàng loạt ứng dụng thú vị và quan trọng khác, đặc biệt là trong lĩnh vực an ninh và ứng phó khẩn cấp.
Tiến sĩ Saripalli nhấn mạnh rằng khả năng phát hiện, nhận biết và dự đoán kết quả từ một người đang có những biểu hiện đe dọa có thể mang lại những tác động to lớn. Một hệ thống AI có thể đọc được sự thay đổi tư thế, sự do dự, định hướng cơ thể hoặc các dấu hiệu căng thẳng thần kinh sẽ là một công cụ thay đổi cuộc chơi cho nhân viên quân sự hoặc lực lượng cứu hộ.
Trong các tình huống rủi ro cao, OmniPredict có thể đóng vai trò như một người cảnh báo sớm, cung cấp thêm một lớp nhận thức tình huống, giúp con người đưa ra các quyết định nhanh chóng và sáng suốt hơn. Mục tiêu cuối cùng không phải là thay thế con người, mà là trang bị cho họ một người cộng sự thông minh hơn để đối phó với sự hỗn loạn của thế giới thực.
Điểm làm nên sự khác biệt của OmniPredict so với các hệ thống cũ nằm ở phương pháp tiếp cận. Các hệ thống thị giác máy tính truyền thống thường gặp khó khăn khi điều kiện môi trường thay đổi, như thời tiết xấu, hành vi bất thường của con người hay các sự kiện hiếm gặp mà chúng chưa từng được huấn luyện. OmniPredict, với nền tảng tư duy của các mô hình ngôn ngữ lớn, không chỉ "nhìn" khung cảnh mà còn "lý giải" nó.
Nhóm nghiên cứu đã thử nghiệm hệ thống này trên hai bộ dữ liệu tiêu chuẩn khó nhằn nhất về hành vi người đi bộ là JAAD và WiDEVIEW mà không cần trải qua bất kỳ quá trình đào tạo chuyên biệt nào trước đó. Kết quả thật sự ấn tượng: OmniPredict đạt độ chính xác lên tới 67%, vượt trội hơn 10% so với các mô hình hiện đại nhất hiện nay.
Đáng kinh ngạc hơn, hệ thống vẫn duy trì được hiệu suất cao ngay cả khi đối mặt với các tình huống khó khăn về mặt ngữ cảnh, chẳng hạn như người đi bộ bị che khuất một phần hoặc đang nhìn về phía xe. AI này cũng thể hiện tốc độ phản hồi nhanh hơn, khả năng khái quát hóa tốt hơn trên các bối cảnh đường phố khác nhau và đưa ra quyết định mạnh mẽ hơn so với các hệ thống truyền thống.
Đây là những tín hiệu đầy hứa hẹn cho việc triển khai trong thế giới thực trong tương lai gần. Dù hiện tại OmniPredict vẫn là một mô hình nghiên cứu và chưa sẵn sàng lăn bánh thương mại, nhưng nó đã vạch ra một hướng đi rõ ràng cho tương lai của xe tự hành: giảm bớt sự phụ thuộc vào việc học vẹt bằng thị giác và chuyển sang tư duy hành vi sâu sắc.
Bằng cách kết hợp khả năng suy luận với nhận thức, OmniPredict đang mở khóa một loại trí tuệ chia sẻ mới - nơi thế giới không chỉ được tự động hóa mà còn trở nên trực quan và thấu cảm hơn rất nhiều. Nếu những chiếc xe trong tương lai có thể đọc được bước đi tiếp theo của chúng ta, con đường phía trước chắc chắn sẽ trở nên thông minh và an toàn hơn gấp bội.












