Con người không hoàn hảo, AI cũng vậy thôi

Trí tuệ nhân tạo đã có những bước tiến vô cùng lớn trong khoảng 2 năm qua. Theo Goldman Sachs Economic Research, đầu tư toàn cầu vào các công nghệ AI sẽ đạt 200 tỷ USD vào năm 2025. Các công nghệ AI vừa mang lại cơ hội, vừa là mối đe dọa đối với ngành báo chí.

Nhà báo Lê Quốc Minh.

Nhà báo Lê Quốc Minh.

Cơ hội và mối đe dọa đối với ngành báo chí

Trong vài thập kỷ qua, các cơ quan báo chí trên thế giới trải qua nhiều khó khăn vì nguồn thu quảng cáo và đặt mua báo in suy giảm. Các công nghệ AI, nếu được ứng dụng và triển khai sớm để tranh thủ tối đa sức mạnh, có thể có tác động tích cực giúp các cơ quan báo chí phát triển bền vững.

Một trong số những tranh luận nóng bỏng nhất trong giới báo chí là việc nên bắt tay với các công ty AI hay khởi kiện bất kỳ công ty nào sử dụng những nội dung có bản quyền để huấn luyện thuật toán của họ.

“Các nền tảng AI nên trả tiền cho báo chí để được sử dụng nội dung và nội dung phải được trích nguồn phù hợp” - Ông Jon Roberts, Giám đốc của Dotdash Meredith nêu quan điểm.

Một báo cáo của The Information tiết lộ rằng OpenAI đang đề nghị trả cho các cơ quan báo chí từ 1-5 triệu USD mỗi năm để truy cập dữ liệu, nhằm huấn luyện các mô hình AI. Có tin thỏa thuận mới với News Corp trị giá tới 250 triệu USD cho 5 năm.

Nic Newman (Viện nghiên cứu Báo chí Reuters) cho rằng cuộc đụng độ giữa những người ủng hộ và phản đối AI sẽ tiếp diễn, dù những người ủng hộ chiếm ưu thế, trong khi các chính phủ đang cố gắng để hiểu và kiểm soát công nghệ này. Nếu 2023 là năm làm quen với AI tạo sinh (GenAI), thì 2024 là năm mà AI tiến vào các tòa soạn trên thế giới bằng nhiều cách thức khác nhau.

GenAI và niềm hứng khởi, nỗi khiếp sợ với các cơ quan báo chí

• Cơ hội

Tiết kiệm thời gian: Hãy tưởng tượng chúng ta có thể tiết kiệm biết bao thời gian nếu sử dụng nó như một trợ lý trong tòa soạn để làm những việc lặt vặt mà các nhà báo rất ghét.

Làm nhiều hơn: Nhờ máy móc xử lý giúp hàng núi dữ liệu, các cơ quan báo chí có thể làm được nhiều việc hơn dù chỉ có nguồn lực hạn chế.

Chinh phục những thị trường mới: Các nội dung văn bản cũng như video và audio có thể được dịch sang các ngôn ngữ khác một cách dễ dàng, giúp chúng ta chinh phục những thị trường mới.

• Đe dọa

Tác động của “zero-click search” có thể khiến mất khoảng 2 tỷ USD doanh thu quảng cáo mỗi năm trong toàn bộ ngành báo chí.

Nghiên cứu của Gartner dự đoán khối lượng tìm kiếm theo cách truyền thống sẽ giảm 25% vào năm 2026.

CEO của Financial Times và các lãnh đạo báo chí khác đã xác định Trải nghiệm tìm kiếm tạo sinh (SGE) là nguy cơ mà họ lo lắng nhất.

Tìm kiếm bằng AI có thể gây thiệt hại tới 1/3 tổng hoạt động kinh doanh của cơ quan báo chí, theo chuyên gia Greg Piechota của INMA.

Mối lo ngại phổ biến khác đối với việc sử dụng GenAI là việc nếu thiếu vắng con người, máy móc sẽ cung cấp cho độc giả thông tin không chính xác, được gọi là “ảo giác AI.”

Vào thời điểm báo chí đang vất vả đối phó với hiện tượng né tránh tin tức và mất niềm tin, các cơ quan báo chí đặc biệt lo ngại về những công nghệ có thể xói mòn độ tin cậy của họ thêm nữa.

Một ví dụ cụ thể là TUAW – một website đã đóng cửa 10 năm trước, được bán cho một quỹ đầu tư tư nhân, sau đó là một công ty ở Hong Kong (Trung Quốc), và giờ nó đánh cắp danh tính của các nhân viên cũ rồi đăng tải các bài viết bằng AI dưới tên của họ.

Những gợi ý cho việc áp dụng AI trong báo chí

Hãy để nhân viên “chơi” với các công cụ GenAI. Dù tòa soạn muốn hay không thì họ vẫn dùng. Thà định hướng hoạt động còn hơn là cấm họ thử nghiệm. Hãy đặt ra nội quy và tiêu chuẩn đạo đức. Khẳng định với nhân viên rằng sử dụng GenAI là để sản xuất nội dung chất lượng cao hơn và sử dụng các nguồn lực hiệu quả.

Nên có thỏa thuận chính thức để các thông tin nhạy cảm không được đưa vào các mô hình GenAI và tòa soạn có thể kiểm soát việc lưu trữ dữ liệu cũng như đối tượng có quyền truy cập.

Xây dựng quy chuẩn đạo đức hoặc tiêu chuẩn sử dụng AI, nhân viên phải đọc và ký vào — rồi công bố. Điều này giúp người dùng hiểu tòa soạn đang dùng GenAI ra sao và giúp xây dựng niềm tin với họ.

Chỉ định một cán bộ điều phối mọi dự án AI để họ là người chia sẻ kiến thức và tìm kiếm dự án phù hợp. Đề nghị họ lập “kho” tập trung về các thử nghiệm GenAI nhằm tránh trùng lặp và giúp các đồng nghiệp học hỏi lẫn nhau.

Tổ chức đào tạo về prompt engineering trong tòa soạn để nhiều nhân viên nắm bắt kỹ năng này. Prompt engineering tốt nhất là dạng đối thoại chứ không phải là câu đơn thì máy móc mới thực sự hiểu yêu cầu và đáp ứng chính xác. Cân nhắc xây dựng một cẩm nang nội bộ về các câu lệnh (prompt) và cho phép nhân viên đóng góp để chính họ có thể học hỏi nhanh chóng. Tính tới cuối năm 2023 chỉ có dưới 10% tòa soạn đã có chương trình đào tạo AI, theo một khảo sát của Viện Nghiên cứu Reuters.

Nếu đang xây dựng công cụ cho tòa soạn, hãy đề nghị các nhà báo giúp thiết kế. Lợi ích của việc này là rất lớn: Tòa soạn thu được ý kiến đóng góp của họ, tức là họ có thể trở thành các đại sứ để triển khai các thử nghiệm tiếp theo.

Con người tham gia. Đảm bảo con người tham gia từ đầu đến cuối quy trình, theo đó con người làm 20% công việc còn máy xử lý 80%.

Mua chứ đừng tự xây. Quy tắc 80/20 cũng có thể áp dụng như sau: Lập kế hoạch mua một công cụ, rồi chỉnh sửa nó. Nói cách khác là để nhà cung cấp lo 80% công việc còn tòa soạn thực hiện 20% còn lại.

Nếu tòa soạn xây dựng mô hình ngôn ngữ lớn (LLM) thì hãy huấn luyện bằng nội dung của mình để nâng cao mức độ chính xác đồng thời cân nhắc sử dụng kỹ thuật “tạo tăng cường truy xuất” (retrieval augmented generation-RAG) để tối ưu hóa đầu ra.

Chớ phụ thuộc hoàn toàn vào GenAI. Nó có thể tóm tắt những gì được nói tại họp báo chứ không hiểu về những điều không được nói ra — và đôi khi, tin tức nằm ở chỗ không được nói ra. Phải là nhà báo bằng xương bằng thịt mới hiểu được ngữ cảnh và tầm quan trọng của những điều không được đề cập và đặt câu hỏi về điều đó.

Dùng GenAI để phân tích dữ liệu, cả cấu trúc và phi cấu trúc. GenAI rất giỏi việc này. Nó rất hữu ích, tiết kiệm thời gian cho phóng viên, phát hiện những khuôn thức không dễ hiện rõ ngay. Gợi ý tiêu đề dựa trên nhu cầu của người dùng chứ không chỉ gợi ý tiêu đề phù hợp với mạng xã hội hoặc phục vụ mục đích SEO. Nó nhấn mạnh giá trị của việc hiểu rõ người dùng khi tạo nội dung và tăng khả năng họ sẽ tiêu thụ nội dung của tòa soạn.

Sử dụng GenAI cho audio. Đây là phương tiện ngày càng phát triển, con đường để tiếp cận thính giả mới và, như thành công của sản phẩm trả phí của New York Times cũng như voicebot chăm sóc khách hàng của Medienhub, nó có hiệu quả về kinh doanh.

Không phụ thuộc quá nhiều vào một công cụ hoặc mô hình GenAI. Công nghệ thay đổi liên tục và một công cụ hoặc mô hình khó chiếm ưu thế lâu dài. Ngoài ra, phụ thuộc sẽ dẫn đến thế khó khi gia hạn thời gian sử dụng.

Không cho robots.txt “bò” vào website nếu không muốn nội dung của tòa soạn bị dùng để huấn luyện dữ liệu. Tính đến cuối năm 2023 mới có khoảng một nửa các cơ quan báo chí trên thế giới chặn các trình thu thập thông tin (crawler), theo Viện Nghiên cứu Reuters. Thực tế, nếu một website tin áp dụng kiểu tóm tắt dạng bullet point ở đầu các bài viết mà không chặn crawler thì các nền tảng AI càng dễ lấy nội dung để huấn luyện các mô hình của họ.

Có nhiều thỏa thuận cấp phép. Nếu tòa soạn cho rằng ký thỏa thuận với các nền tảng GenAI là cách tạo nguồn thu tốt và nâng vị thế trong không gian tìm kiếm bằng AI, thì hãy thương lượng để có thỏa thuận với một số nhà cung cấp GenAI. Các công ty AI rất cần nội dung chất lượng cao trong cuộc đua huấn luyện các mô hình ngôn ngữ của mình, vì thế hãy nghĩ xem cái gì thực sự giá trị đối với họ trong khi thương thảo.

Con người không hoàn hảo, và AI cũng vậy thôi

Năng suất trong báo chí nhờ AI sẽ không tăng mãi. Những lợi ích của AI trong báo chí sẽ có lúc nhiều lúc ít. Chi phí sẽ gia tăng trong giai đoạn ban đầu và cần phải có những thay đổi ở cấp độ tổ chức và mang tính chiến lược.

AI do con người tạo ra, nó sẽ có lỗi. Công nghệ AI trong hình hài của hôm nay không thể nào không bao giờ mắc sai lầm.

Chính những định kiến mà AI đã thể hiện là mối quan ngại lớn nhất

“Chỉ có báo chí mới cứu được báo chí. Phải trung thành với tờ báo, đầu tư vào tài năng, và đừng phụ thuộc quá nhiều vào GenAI với kỳ vọng cứu giúp hoạt động của tờ báo.” – đó là phát biểu của ông Steffen Damborg, CEO và tác giả cuốn “Làm chủ quá trình chuyển đổi số”.

Nhà báo LÊ QUỐC MINH (Tổng biên tập báo Nhân Dân, Chủ tịch Hội Nhà báo Việt Nam)

Nguồn Đại Đoàn Kết: https://daidoanket.vn/con-nguoi-khong-hoan-hao-ai-cung-vay-thoi-10288953.html