Dùng AI kiểm soát nhạc tạo bởi AI là cuộc đua thú vị trong âm nhạc
Ngành công nghiệp âm nhạc năm 2023 đã có một cú sốc với một ca khúc lan truyền có tên 'Heart on My Sleeve' bắt chước giọng Drake và The Weeknd một cách thuyết phục, đến mức thu hút hàng triệu lượt nghe trước khi ai đó kịp xác nhận tác giả thật sự.
Điều khiến người ta "hoảng hốt" không chỉ là âm thanh, mà là nhận thức rõ ràng rằng không ai thực sự kiểm soát được AI khi nó được sử dụng trong lĩnh vực âm nhạc. Trước tình hình ấy, thế giới âm nhạc đang âm thầm phát triển công nghệ mới để đối phó với ca khúc được tạo bởi AI.
Các nhà phát triển đang tích hợp hệ thống phát hiện vào mọi giai đoạn của quá trình âm nhạc - từ lúc huấn luyện mô hình, tải lên nền tảng, cho đến cơ sở dữ liệu cấp phép và thuật toán đề xuất. Mục tiêu không phải cấm âm nhạc tổng hợp, mà là gắn nhãn và theo dõi nó.
Matt Adell, nhà đồng sáng lập Musical AI, giải thích: “Nếu bạn không xây dựng những thứ này ngay từ trong hạ tầng, bạn sẽ chỉ mãi đuổi theo cái đuôi của chính mình. Bạn cần một hạ tầng hoạt động từ lúc huấn luyện cho đến phân phối”.
AI đang trở thành một phần của hệ sinh thái âm nhạc
Các startup và nền tảng lớn đang gấp rút tích hợp công cụ phát hiện AI vào quy trình cấp phép và xuất bản. YouTube và Deezer đã bắt đầu gắn cờ nội dung do AI tạo ra ngay khi được tải lên, ảnh hưởng trực tiếp đến vị trí hiển thị trong kết quả tìm kiếm và nguồn đề xuất. Các nền tảng như SoundCloud, Audible Magic, Pex và Rightsify cũng đang mở rộng công cụ kiểm duyệt và nhận diện trong hệ sinh thái của họ.
Quá trình phát triển nhanh chóng này đang tạo nên một mạng lưới các hệ thống phát hiện đan xen nhau, với mục tiêu truy vết nhạc AI ngay từ thời điểm nó ra đời. Các công ty như Vermillio và Musical AI đã phát triển phần mềm tự động gắn nhãn các ca khúc là tổng hợp, nhúng dữ liệu này vào siêu dữ liệu (metadata) của bản nhạc.

Nhạc do AI tạo ra ngày càng khiến người ta ngạc nhiên
Ví dụ, TraceID của Vermillio có thể phân tích bài hát theo từng thành phần, như âm sắc giọng hát hay lời ca và xác định những phần nào do AI tạo ra. Nó có khả năng phát hiện hành vi bắt chước ngay cả khi chỉ sử dụng một vài yếu tố của ca khúc gốc. Điều này đặc biệt hữu ích cho các chủ sở hữu bản quyền muốn được thông báo và đưa ra phương án cấp phép trước khi một bản nhạc được phát hành.
Không giống như hệ thống Content ID của YouTube, vốn thường bỏ sót những bản nhái tinh vi, TraceID hướng đến việc cấp phép chủ động, có xác minh, thay vì chỉ trừng phạt bản sao chép. Vermillio dự đoán thị trường cấp phép xác thực như vậy có thể tăng từ 75 triệu USD trong năm 2023 lên đến 10 tỉ USD vào năm 2025. Trọng tâm không nằm ở việc “bắt lỗi sao chép” mà ở việc đo lường ảnh hưởng sáng tạo và tạo ra các thỏa thuận công bằng ngay từ đầu.
Dữ liệu huấn luyện AI đang được kiểm tra kỹ lưỡng
Một số công ty còn tiến xa hơn, tập trung phân tích dữ liệu được dùng để huấn luyện các mô hình AI âm nhạc. Bằng cách kiểm tra đầu vào các huấn luyện, họ sẽ xác định mức độ ca khúc được tạo ra vay mượn từ nghệ sĩ hoặc phong cách nào. Phương pháp này có thể cho phép cấp phép dựa trên mức ảnh hưởng, ngay từ trước khi ca khúc được ra mắt.
Sean Power, đồng sáng lập Musical AI, mô tả hệ thống của họ như một công cụ khép kín. Power khẳng định: “Chúng tôi đang cố gắng định lượng ảnh hưởng sáng tạo, chứ không chỉ bắt lỗi đạo nhái”.
Trong khi đó, Deezer đã sử dụng công nghệ nội bộ để nhận diện và hạn chế độ phổ biến của các bản nhạc hoàn toàn do AI tạo ra. Tính đến tháng 4 năm nay, khoảng 20% số lượt tải lên mỗi ngày được xác định là do AI tạo — gấp đôi so với tháng 1. Những bản nhạc này vẫn được giữ lại trên nền tảng, nhưng không được đề xuất bởi thuật toán hay các biên tập viên. Sắp tới, Deezer sẽ thêm nhãn rõ ràng để người dùng biết bản nhạc nào do AI tạo ra.
Aurélien Hérault, Giám đốc Đổi mới của Deezer, khẳng định: “Chúng tôi hoàn toàn không chống lại AI. Nhưng rất nhiều nội dung này đang bị sử dụng với mục đích trục lợi, chứ không phải sáng tạo. Đó là lý do vì sao chúng tôi chú ý đến nó như vậy”.
Spawning AI đang đẩy việc phát hiện lên cao hơn trong chuỗi sáng tạo, thông qua Giao thức không huấn luyện (Do Not Train Protocol - DNTP), cho phép các nhạc sĩ từ chối việc tác phẩm của họ bị sử dụng trong huấn luyện AI. Trong khi giới họa sĩ đã có công cụ tương tự, ngành âm thanh lại chậm hơn trong việc bắt kịp xu thế. Hiện vẫn chưa có một cách tiếp cận tiêu chuẩn nào về sự đồng thuận và minh bạch ở quy mô lớn.