Dữ liệu mở cho AI và bài toán bảo vệ sáng tạo Việt

15/12/2025 - 07:18

PNO - Luật Sở hữu trí tuệ (sửa đổi) vừa được Quốc hội thông qua ngày 10/12 lần đầu cho phép sử dụng thông tin đã được công bố hợp pháp, công khai để huấn luyện trí tuệ nhân tạo (AI), với điều kiện sản phẩm đầu ra không xâm phạm quyền tác giả và các quyền sở hữu trí tuệ liên quan. Quy định này mở ra cơ hội lớn cho phát triển AI, đồng thời đặt ra những thách thức mới về ranh giới giữa đổi mới công nghệ và bảo vệ giá trị sáng tạo.

Bước tiến trong xu hướng dữ liệu mở

Trong cuộc đua AI toàn cầu, quốc gia nào không mở rộng nền tảng dữ liệu nuôi sống AI sẽ khó bắt kịp tốc độ phát triển. Việc Việt Nam cho phép sử dụng dữ liệu công khai hợp pháp để huấn luyện mô hình được nhìn nhận là bước đi hợp lý và có tầm nhìn. Tuy nhiên, thách thức không nằm ở đầu vào mà ở khả năng kiểm soát đầu ra sao cho không xâm phạm quyền tác giả và giá trị sáng tạo của con người.

Những vụ sao chép tác phẩm nhiếp ảnh thành tranh gây bức xúc trong dư luận - Nguồn ảnh: Internet
Những vụ sao chép tác phẩm nhiếp ảnh thành tranh gây bức xúc trong dư luận - Nguồn ảnh: Internet

Nhật Bản đã cho phép AI sử dụng dữ liệu công khai từ năm 2018. Singapore cũng áp dụng ngoại lệ tương tự để thúc đẩy đổi mới. Tổ chức Hợp tác và Phát triển kinh tế (OECD) ước tính khoảng 80% mô hình AI hiện nay được huấn luyện từ dữ liệu thu thập trong không gian công cộng. Trong bối cảnh đó, mô hình “mở đầu vào, kiểm soát đầu ra” trở thành logic chung của nhiều quốc gia muốn đảm bảo tự chủ công nghệ, tránh tụt hậu trong cuộc đua AI.

Song, đầu ra của AI lại là vùng rủi ro cao. Ngay cả các quốc gia đi đầu về công nghệ cũng đang loay hoay tìm lời giải. Vụ kiện giữa New York Times và OpenAI - Microsoft giai đoạn 2023-2024 kéo dài nhiều tháng vì nghi vấn mô hình AI học quá kỹ nội dung và có khả năng tái tạo đoạn văn tương tự. Ở Anh và Mỹ, nhiều nhạc sĩ lên tiếng khi AI có thể tạo ra giai điệu giống đến mức khó phân biệt. EU yêu cầu các mô hình minh bạch về nguồn dữ liệu huấn luyện...

Thách thức pháp lý

Khi chưa có tiêu chuẩn rõ ràng, nguy cơ tranh chấp là rất lớn, khiến cả nghệ sĩ lẫn doanh nghiệp AI đều rơi vào thế bị động. Một bài hát, truyện ngắn hay bức ảnh đăng tải trên mạng có thể nhanh chóng trở thành nguyên liệu cho AI học hỏi, dấy lên nỗi lo sản phẩm sáng tạo được sử dụng để tạo ra các phiên bản cạnh tranh. Doanh nghiệp AI cũng đối mặt rủi ro khi chỉ cần một phần đầu ra na ná tác phẩm gốc đã có thể bị xem là xâm phạm bản quyền.

Một bức tranh bị tố sao chép từng gây nhiều tranh cãi. Ảnh: Internet
Một bức tranh bị tố sao chép từng gây nhiều tranh cãi. Ảnh: Internet

Theo luật sư Nguyễn Quốc Cường (Đoàn Luật sư TPHCM), việc cho phép AI sử dụng dữ liệu đầu vào là xu thế tất yếu để thúc đẩy công nghệ nhưng cũng là bài toán pháp lý cấp thiết, phức tạp. Theo ông, quy định này chỉ thực sự phát huy hiệu quả khi đi kèm cơ chế bảo vệ quyền lợi chính đáng của người sáng tạo và đảm bảo tính minh bạch cho doanh nghiệp AI. Cần sớm hoàn thiện khung quyền tác giả trong môi trường AI, làm rõ thế nào là dữ liệu “được công bố hợp pháp, công khai, công chúng được tiếp cận”.

Học để nuôi dưỡng cá tính sáng tạo khác với lặp lại nguyên xi những gì đã có

“Từ trước cả khi có AI, chuyện sao chép ý tưởng đã tồn tại. Đến nay, chúng ta vẫn chưa có cơ chế thực sự hiệu quả để bảo vệ quyền tác giả hay chấm dứt triệt để thực trạng này. Thời đại AI chỉ khiến việc sao chép trở nên tinh vi và nhanh hơn chứ không làm thay đổi bản chất vấn đề. Vì vậy, người làm sáng tác buộc phải tự tìm cách thích nghi. Với tôi, điều quan trọng nhất vẫn là bền bỉ tìm kiếm những sáng tạo mới lạ, hấp dẫn, tạo được dấu ấn riêng. Học hỏi từ công trình của người đi trước là cần thiết nhưng học để nuôi dưỡng cá tính sáng tạo hoàn toàn khác với việc lặp lại nguyên xi những gì đã có”.

Nhạc sĩ Nguyễn Văn Chung

Đồng thời, phân định rạch ròi giữa việc AI học từ tác phẩm đã được bảo hộ và hành vi tạo đầu ra có yếu tố sao chép hoặc phái sinh. Việc xây dựng các tiêu chí đánh giá mức độ tương đồng giữa sản phẩm AI và tác phẩm gốc cùng nguyên tắc sử dụng hợp lý được xem là then chốt để hạn chế tranh chấp.

Luật sư Nguyễn Quốc Cường cũng nhấn mạnh sự cần thiết của cơ chế cấp phép tập thể, trả phí bản quyền minh bạch cho việc sử dụng tác phẩm huấn luyện AI, cũng như hoàn thiện quy định về bồi thường thiệt hại khi tác phẩm bị khai thác thương mại thông qua AI. Ngoài ra, để doanh nghiệp AI yên tâm phát triển, cần tăng cường yêu cầu minh bạch nguồn dữ liệu huấn luyện, trách nhiệm thẩm định đầu vào và làm rõ trách nhiệm pháp lý giữa nhà phát triển AI và người sử dụng khi đầu ra bị xác định xâm phạm bản quyền.

Ở góc nhìn rộng hơn, quy định mới phản ánh sự chuyển dịch nhận thức quan trọng. Dữ liệu công khai đang trở thành tài nguyên phát triển kinh tế, trong khi sáng tạo của con người vẫn là giá trị cốt lõi cần được bảo vệ. Nếu được triển khai bài bản, quy định về dữ liệu mở có thể tạo cú hích lớn cho ngành AI Việt Nam.

Thiên Bảo

 

news_is_not_ads=
TIN MỚI