AI 'dẫn đường' cho người khiếm thị

Người khuyết tật lâu nay bị bỏ qua trong quá trình phát triển của công nghệ nói chung nhưng điều này đang dần thay đổi.

Ứng dụng Lookout của Google sẽ sử dụng giọng nói để hướng dẫn người khiếm thị vượt qua các đồ vật cụ thể nào đó.

Một tai nạn tại hồ bơi khiến Chieko Asakawa bị mù ở tuổi 14. Trong ba thập kỷ qua, cô đã làm việc để tạo ra công nghệ nhằm thay đổi cuộc sống của người khiếm thị. “Khi tôi bắt đầu, không có công nghệ hỗ trợ. Tôi không thể tự đọc bất kỳ thông tin nào. Tôi cũng không thể tự đi bất cứ đâu”, tiến sĩ Asakawa, người sinh trưởng ở Nhật Bản, nhớ lại.

Người đi tiên phong

Những “trải nghiệm đau đớn” đó đã dẫn dắt Chieko Asakawa đi vào con đường công nghệ, khởi đầu bằng một khóa học về khoa học máy tính dành cho người mù và không lâu sau đó là một công việc tại hãng công nghệ IBM của Mỹ. Cô bắt đầu công việc đi tiên phong về hỗ trợ người khiếm thị tại công ty, đồng thời đạt được bằng tiến sĩ.

Cô là người đứng sau những phát minh ban đầu về chữ nổi kỹ thuật số và tạo ra trình duyệt có thể đọc nội dung trang web. Những trình duyệt có tính năng này giờ đang ngày một phổ biến và sự ra đời của nó vào khoảng 20 năm trước đã giúp người mù Nhật Bản tiếp cận nhiều thông tin hơn trước khi sử dụng Internet.

Giờ đây, cô Asakawa và các chuyên gia công nghệ khác đang tìm cách khai thác công nghệ trí tuệ nhân tạo (AI) để phát triển thêm nhiều công cụ mới cho người khiếm thị. Chẳng hạn như nữ chuyên gia này đã phát triển NavCog, một ứng dụng điện thoại thông minh được điều khiển bằng giọng nói, giúp người mù đi lại tại các địa điểm phức tạp trong nhà. Ứng dụng này phân tích tín hiệu từ thiết bị phát sóng Bluetooth lắp đặt dọc các lối đi dành cho người đi bộ và từ bộ cảm biến của điện thoại để giúp người sử dụng di chuyển mà không cần sự hỗ trợ.

Điều kỳ diệu nêu trên xảy ra khi thuật toán giúp người khiếm thị nhận biết họ đang ở đâu gần như trong thời gian thực, đang đi hướng đi nào và biết thêm thông tin về môi trường xung quanh. Ngoài ra, dữ liệu thu thập từ các thiết bị phát sóng Bluetooth năng lượng thấp – được lắp đặt cách nhau khoảng 10m – giúp tạo ra một bản đồ trong nhà chi tiết hơn so với phiên bản hiện có trong những ứng dụng như Google Maps vốn chỉ hỗ trợ địa điểm ngoài trời và không thể cung cấp mức độ chi tiết mà những người mùa hoặc khiếm thị cần đến. “Các dịch vụ bản đồ hiện có rất hữu ích nhưng không thể giúp những người khiếm thị như chúng tôi đi lại chính xác”, tiến sĩ Asakawa nhấn mạnh.

Kỹ sư phần mềm Saqib Shaikh của Microsoft và ứng dụng biến văn bản thành giọng nói của công ty.

Bà Christine Hunsinger, 70 tuổi và chồng Douglas Hunsinger, 65 tuổi, vừa dùng thử NavCog tại một khách sạn tại thành phố Pittsburgh (Mỹ) trong khuôn khổ một cuộc hội nghị dành cho người mù. Từng dùng qua một số ứng dụng để hỗ trợ sự đi lại, bà nhận định NavCog giúp bà di chuyển tự do hơn tại những nơi xa lạ. Người chồng cũng cho rằng ứng dụng cho phép ông tự di chuyển một mình tại các địa điểm trong nhà.

Ứng dụng NavCog hiện trong giai đoạn thử nghiệm, có thể sử dụng tại một số địa điểm ở Mỹ và Nhật Bản. IBM cho biết đang tiến gần việc cung cấp rộng rãi ứng dụng cho công chúng. Thách thức lớn tiếp theo của tiến sĩ Asakawa là “chiếc vali AI” - một loại robot dẫn đường giúp người mù đi qua những khu vực phức tạp, như bên trong sân bay và cung cấp những thông tin hữu ích, như tình trạng trễ chuyến bay và thay đổi cổng.

AI vì điều tốt

Chiếc vali được trang bị một động cơ để có thể di chuyển tự động, một camera nhận biết hình ảnh để phát hiện môi trường xung quanh và công nghệ Lidar dùng để đo khoảng cách đến các vật thể. Khi cần leo cầu thang, chiếc vali sẽ báo cho người sử dụng để họ nhặt nó lên. Nguyên mẫu hiện tại vẫn còn khá nặng và IBM đang nỗ lực hoàn thiện để thiết bị trở nên nhẹ, nhỏ và có chi phí thấp hơn. Tập đoàn công nghệ này thậm chí hy vọng nó có thể chứa ít nhất một máy tính xách tay. IBM đặt mục tiêu đưa robot vào sử dụng thí điểm ở Tokyo vào năm 2020 nhưng hiện chưa hé lộ thêm nhiều thông tin về nó.

Bất chấp những nỗ lực nói trên, IBM vẫn còn tụt lại phía sau so với những tên tuổi như Microsoft và Google về loại sản phẩm, công nghệ cải thiện cuộc sống người khiếm thị. Microsoft đã cam kết 115 triệu đô la cho chương trình AI for Good, tạm dịch là AI vì những điều tốt đẹp và 25 triệu đô la cho sáng kiến của riêng mình về việc tận dụng AI để hỗ trợ người khuyết tật. Chẳng hạn như ứng dụng Seeing AI sử dụng camera thiết bị để đọc cho người khiếm thị biết xung quanh họ có gì, người đối diện là ai, bao nhiêu tuổi, có phải người quen hay không, nhận dạng chữ viết tay…

Trong khi đó, Google đang lên kế hoạch ra mắt ứng dụng Lookout, ban đầu chỉ mới dành cho điện thoại Pixel. Ứng dụng sẽ sử dụng giọng nói để hướng dẫn người khiếm thị vượt qua các đồ vật cụ thể nào đó.

Cô Chieko Asakawa đang sử dụng ứng dụng NavCog tại khuôn viên trường Đại học Carnegie Mellon.

Ông Nick McQuire, người đứng đầu bộ phận nghiên cứu doanh nghiệp và AI tại công ty CCS Insight (Anh) nhận định người khuyết tật lâu nay bị bỏ qua trong quá trình phát triển của công nghệ nói chung. Tuy nhiên, điều này đang dần thay đổi trong năm qua khi một số các công ty công nghệ lớn đẩy mạnh đầu tư vào các ứng dụng AI “cải thiện phúc lợi xã hội”, trong đó nổi bật là Microsoft và Google. Ông hy vọng sẽ có thêm tên tuổi tham gia vào lĩnh vực này, như tập đoàn điện tử Amazon vốn đang đầu tư đáng kể vào AI.

Ông McQuire nhận định thêm rằng xu hướng nói trên phần nào có liên quan đến nỗ lực xóa bỏ lối suy nghĩ tiêu cực về AI, liên quan đến cảnh báo công nghệ này có thể làm nhiều công việc thay con người. Vấn đề là ứng dụng AI để giúp người khuyết tật vẫn chưa được hoàn hảo như sự kỳ vọng, trước mắt chỉ mới tập trung chứng minh tính chính xác và tốc độ của các ứng dụng. “Tôi đã đương đầu với không ít sự khó khăn khi bị mù. Tôi hy vọng những khó khăn này có thể được giải quyết”, cô Asakawa đúc kết đơn giản về những gì mình đang làm.

Mở rộng phạm vi sử dụng

Ứng dụng NavCog là dự án thí điểm đầu tiên trong chương trình hợp tác giữa IBM và trường Đại học Carnegie Mellon (CMU) nhằm phát triển những giải pháp hỗ trợ người khiếm thị đi lại dễ dàng như người thường trong môi trường quanh mình. Chuyên gia Kris Kitani của CMU cho biết một trong những mục tiêu hàng đầu của dự án là mở rộng phạm vi sử dụng càng nhiều càng tốt. Để hỗ trợ mục tiêu này, các nhà khoa học đã biến NavCog thành một nền tảng hoàn toàn mở cho các nhà phát triển bên ngoài để họ tham gia cải thiện hệ thống và đẩy nhanh tốc độ triển khai ở nhiều nơi khác.

Một mục tiêu khác là giúp hệ thống NavCog hoạt động trong bất kỳ môi trường nào, ngay cả khi không có thiết bị phát sóng Bluetooth. Để kịch bản này thành hiện thực, CMU hy vọng những tiến bộ trong công nghệ tầm nhìn máy tính (computer vision) giúp người khiếm thị tiếp nhận thông tin dễ dàng hơn bằng cách tăng cường những khả năng bị mất hoặc suy yếu của họ. Chẳng hạn như công nghệ mới có thể giúp các nhà nghiên cứu phát triển một hệ thống chính xác hơn mà không cần đến thiết bị phát sóng Bluetooth. Chưa hết, công nghệ nhận biết khuôn mặt có thể được bổ sung để giúp người sử dụng biết được nếu đi ngang qua ai đó có quen biết.

(BBC, The Washington Post)

H. Minh

Nguồn Saigon Times: http://www.thesaigontimes.vn/284083/ai-dan-duong-cho-nguoi-khiem-thi.html