Truyền thông Mỹ kêu gọi ban hành luật ngăn việc 'đánh cắp' dữ liệu để huấn luyện AI
Trong phiên điều trần trước Thượng viện ngày 10/1, giám đốc điều hành của một số hãng thông tấn Mỹ đã kêu gọi Quốc hội nước này ban hành một đạo luật mới nhằm buộc các công ty phát triển trí tuệ nhân tạo (AI) phải trả tiền cho những nội dung báo chí mà họ sử dụng để huấn luyện các mô hình máy tính của mình.
Phiên điều trần diễn ra sau khi một loạt chatbot AI mới xuất hiện, đặc biệt là ChatGPT của OpenAI, gây nên làn sóng “khủng hoảng hiện sinh” trong các tổ chức truyền thông, đe dọa làm xáo trộn thêm ngành công nghiệp vốn đã chứng kiến hàng nghìn việc làm bị cắt giảm những năm gần đây.
Ông Roger Lynch, Giám đốc điều hành của hãng tin Condé Nast, cáo buộc các mô hình AI hiện tại được xây dựng bằng cách sử dụng những “hàng hóa bị đánh cắp”, trong đó các chatbot “lấy trộm” và hiển thị ở đầu ra nội dung tin tức từ các đơn vị xuất bản mà không có sự cho phép hoặc bồi thường cho họ.
Tháng 12 vừa qua, The New York Times - một trong những tờ báo uy tín nhất nước Mỹ - đã đệ đơn kiện OpenAI và Microsoft với cáo buộc hai công ty này sử dụng trái phép hàng nghìn bài viết của họ để huấn luyện các mô hình AI.
Trong hồ sơ khởi kiện, tờ báo này nêu bật mong muốn của các đơn vị xuất bản tin tức trong việc ngăn chặn các mô hình AI thu thập và sử dụng trái phép các bài báo mà không có sự bồi thường thỏa đáng.
Đây không chỉ là vấn đề của riêng ngành truyền thông khi mà cũng trong năm 2023, các công ty phát triển trí tuệ nhân tạo đã vướng 2 vụ kiện lớn về vi phạm bản quyền - một vụ từ diễn viên hài Sarah Silverman và 2 tác giả khác, và một vụ kiện tập thể với chữ ký của hơn 8.000, trong đó có nhiều nhà văn nổi tiếng như Margaret Atwood, Philip Pullman, Jonathan Franzen, Jodi Picoult hay Michael Pollan.
Để tránh việc “đánh cắp” nội dung của các nhà xuất bản tin tức, ông Roger Lynch kiến nghị các công ty phát triển AI chỉ sử dụng những nội dung đã được cấp phép và phải bồi thường cho các nhà xuất bản đối với những nội dung họ đã sử dụng để huấn luyện các mô hình AI và hiển thị ở kết quả đầu ra.
“Đề xuất này sẽ giúp bảo đảm một hệ sinh thái bền vững và cạnh tranh, trong đó nội dung chất lượng cao tiếp tục được sản xuất và các thương hiệu uy tín có thể tồn tại, đem lại cho xã hội những thông tin cần thiết”, Giám đốc điều hành hãng tin Condé Nast nói.
Bà Danielle Coffey, Chủ tịch kiêm Giám đốc điều hành của Liên minh Tin tức/Truyền thông (News/Media Alliance), cho biết trong ngành truyền thông tin tức đã tồn tại một hệ sinh thái cấp phép lành mạnh, khi nhiều nhà xuất bản thực hiện số hóa kho dữ liệu khổng lồ của mình để phục vụ nhu cầu sử dụng.
Tuy nhiên, do thu thập nội dung cả từ các nguồn không đáng tin cậy, các mô hình AI đã đưa ra những thông tin không chính xác và tạo ra hiện tượng “ảo giác AI” (hallucination) - điều này có nguy cơ gây thông tin sai lệch cho công chúng hoặc làm ảnh hưởng đến danh tiếng của một tờ báo.
Trong khi đó, bà Curtis LeGeyt, Chủ tịch kiêm Giám đốc điều hành của Hiệp hội phát thanh truyền hình quốc gia Mỹ, cho rằng những nhân vật nổi tiếng phụ thuộc vào sự tin tưởng từ khán giả, và niềm tin này có thể bị đe dọa bởi việc sử dụng trí tuệ nhân tạo để tạo ra những deepfake và thông tin thất thiệt.
Mặc dù việc áp dụng các biện pháp bảo vệ pháp lý có thể giúp các hãng tin bảo vệ nội dung của họ không bị các mô hình AI lợi dụng, nhưng điều này cũng có thể mang lại lợi ích cho các nhà phát triển AI về lâu dài, bởi các mô hình AI tạo sinh và sản phẩm mà chúng tạo ra sẽ không bền vững nếu chất lượng nội dung đầu vào của các mô hình này bị suy giảm.
“Cả hai có thể cùng tồn tại một cách hòa hợp và cùng phát triển”, bà LeGeyt nhấn mạnh.