Tai nghe cũng biết dịch nói, cuộc đua AI của các Big Tech ngày càng sôi động

Apple, Google và Meta đang chạy đua ứng dụng AI vào việc biến giấc mơ 'nghe gì hiểu nấy' thành hiện thực với các thiết bị có khả năng dịch nói theo thời gian thực.

Trong sự kiện ra mắt iPhone 17, Apple trình chiếu video thể hiện kịch bản mơ ước của nhiều du khách. Video này cho thấy một du khách nói tiếng Anh đang mua hoa tại một quốc gia nói tiếng Tây Ban Nha không được nêu tên. Người bán hoa nói tiếng Tây Ban Nha với du khách, nhưng những gì du khách nghe được lại là tiếng Anh rõ ràng và mạch lạc.

“Ngày hôm nay tất cả hoa cẩm chướng đỏ giảm giá 50%”, du khách nghe được bằng tiếng Anh qua tai nghe, gần như đồng thời với lúc nhân viên nói.

Video là tư liệu quảng cáo cho AirPods Pro 3 mới nhất của Apple, nhưng tính năng này cũng đã có trong nhiều sản phẩm tương tự từ các công ty công nghệ khác, bao gồm Alphabet – công ty mẹ của Google – và Meta, chủ sở hữu Facebook và Instagram.

Apple đưa tính năng dịch trực tiếp lên tai nghe airpods. (Ảnh: Apple)

Apple đưa tính năng dịch trực tiếp lên tai nghe airpods. (Ảnh: Apple)

Những tiến bộ công nghệ được thúc đẩy bởi sự xuất hiện của ChatGPT của OpenAI vào cuối năm 2022 đã mở ra kỷ nguyên của trí tuệ nhân tạo tạo sinh (generative AI). Gần ba năm sau, những tiến bộ đó đang dẫn đến những công cụ dịch ngôn ngữ theo thời gian thực.

Đối với Apple, Live Translation (Dịch trực tiếp) là một điểm nhấn quan trọng cho AirPods Pro 3, sản phẩm mà công ty vừa ra mắt hôm thứ Ba. Cặp tai nghe mới giá 250 USD sẽ được bán ra vào tuần tới, và với Live Translation, người dùng sẽ có thể ngay lập tức nghe các ngôn ngữ như Pháp, Đức, Bồ Đào Nha và Tây Ban Nha được dịch sang tiếng Anh. Tính năng Live Translation cũng sẽ được cập nhật cho AirPods 4 và AirPods Pro 2.

Khi hai người đeo AirPods trò chuyện với nhau, cuộc hội thoại có thể được dịch hai chiều cùng lúc ngay bên trong tai nghe của từng người. (Ảnh: MacRumors)

Khi hai người đeo AirPods trò chuyện với nhau, cuộc hội thoại có thể được dịch hai chiều cùng lúc ngay bên trong tai nghe của từng người. (Ảnh: MacRumors)

Các nhà phân tích đánh giá rằng tính năng này có thể đánh dấu một bước tiến quan trọng trong chiến lược AI của Apple. Tính năng dịch này cần được kết hợp với iPhone đời mới đủ để chạy Apple Intelligence, bộ phần mềm AI của Apple.

“Nếu chúng ta thực sự có thể dùng AirPods để dịch trực tiếp, đây sẽ là một tính năng khiến mọi người muốn nâng cấp thiết bị”, nhà phân tích Gil Luria từ DA Davidson.

Sôi động cuộc đua thiết bị phiên dịch

Trong năm qua, Google và Meta cũng đã ra mắt các sản phẩm phần cứng với khả năng dịch theo thời gian thực.

Điện thoại Pixel 10 của Google có tính năng có thể dịch lời nói của người nói sang ngôn ngữ của người nghe trong các cuộc gọi. Tính năng này, gọi là Voice Translate, còn được thiết kế để giữ nguyên ngữ điệu của giọng nói người nói. Voice Translate sẽ bắt đầu xuất hiện trên điện thoại của người dùng thông qua bản cập nhật phần mềm vào thứ Hai tới.

 MC Jimmy Fallon cầm trên tay chiếc điện thoại gập Pixel 10 Pro Fold có tính năng Voice Translate, dịch cuộc gọi theo thời gian thực và giữ nguyên giọng của người nói. (Ảnh: Reuters)

MC Jimmy Fallon cầm trên tay chiếc điện thoại gập Pixel 10 Pro Fold có tính năng Voice Translate, dịch cuộc gọi theo thời gian thực và giữ nguyên giọng của người nói. (Ảnh: Reuters)

Trong buổi trình diễn trực tiếp của Google vào tháng 8, Voice Translate đã dịch một câu nói của nghệ sĩ Jimmy Fallon sang tiếng Tây Ban Nha và vẫn giữ được giọng điệu đặc trưng của anh. Trong khi đó, tính năng của Apple không cố gắng bắt chước giọng người dùng.

Còn Meta, vào tháng 5, thông báo rằng kính Ray-Ban Meta của hãng sẽ có khả năng dịch lời nói sang ngôn ngữ khác thông qua loa trên thiết bị, và phía đối thoại sẽ có thể xem các câu trả lời đã được dịch được ghi lại trên điện thoại của người dùng.

Theo báo cáo của CNBC hồi tháng 8, Meta sẽ tổ chức buổi giới thiệu sản phẩm riêng vào tuần tới, dự kiến ra mắt thế hệ kính thông minh tiếp theo có một màn hình nhỏ trên một trong các thấu kính. Hiện chưa rõ Meta có giới thiệu thêm các tính năng dịch thuật mới hay không.

Kính Ray-Ban Meta glasses cho phép nghe dịch và xem bản dịch trên điện thoại.

Kính Ray-Ban Meta glasses cho phép nghe dịch và xem bản dịch trên điện thoại.

Trong vài năm gần đây, một loạt thiết bị dịch thuật chuyên dụng đã xuất hiện trên thị trường, tận dụng mạng di động tốc độ cao toàn cầu và cải tiến các dịch vụ dịch trực tuyến, tạo ra những thiết bị nhỏ gọn hoặc tai nghe tích hợp chức năng dịch với giá chỉ vài trăm USD.

“Điều tôi thích ở Apple là họ thực sự làm nổi bật mức độ cấp thiết của vấn đề này,” Joe Miller, giám đốc điều hành khu vực Mỹ của Pocketalk – hãng sản xuất thiết bị dịch thuật giá 299 USD, có thể dịch cuộc trò chuyện giữa hai người nói hai ngôn ngữ khác nhau bằng cả âm thanh và văn bản – nhận xét.

Với khoảng 18 triệu tai nghe không dây được Apple bán ra chỉ trong quý I năm nay, theo số liệu của Canalys, việc Apple gia nhập thị trường sẽ giúp nhiều khách hàng hơn tiếp cận những tiến bộ trong công nghệ dịch thuật.

Dù Apple đã tham gia thị trường, các nhà sản xuất thiết bị chuyên dụng cho rằng sự tập trung vào độ chính xác và kiến thức ngôn ngữ sẽ mang lại kết quả dịch tốt hơn so với những gì một chiếc điện thoại mới có thể cung cấp miễn phí.

“Chúng tôi thực sự đã thuê các nhà ngôn ngữ học,” Aleksander Alski, trưởng bộ phận Mỹ và Canada của Vasco Electronics – hãng sắp ra mắt tai nghe dịch thuật có khả năng bắt chước giọng nói người dùng giống như tính năng của Google – chia sẻ. “Chúng tôi kết hợp AI với dữ liệu đầu vào từ con người, nhờ đó, chúng tôi đạt được độ chính xác cao hơn nhiều ở tất cả các ngôn ngữ mà chúng tôi cung cấp.”

Ngoài ra, các hãng thiết bị chuyên dụng còn có lợi thế sân nhà. Thị trường lớn nhất của Vasco Electronics là châu Âu, trong khi tính năng Live Translation của Apple hiện chưa khả dụng với người dùng EU, theo thông tin trên trang web của hãng.

Một số sản phẩm mới ra mắt từ các công ty công nghệ vẫn còn hạn chế, chỉ hỗ trợ một số lượng ngôn ngữ nhất định. Apple mới chỉ cung cấp tính năng này với năm ngôn ngữ, trong khi Pocketalk hỗ trợ tới 95 ngôn ngữ.

Ngọc Nguyên (CNBC)

Nguồn VTC: https://vtcnews.vn/tai-nghe-cung-biet-dich-noi-cuoc-dua-ai-cua-cac-big-tech-ngay-cang-soi-dong-ar965160.html