Thận trọng với thông tin giả từ trí tuệ nhân tạo AI

05/07/2019 - 14:51

Chương trình tạo văn bản thông qua trí tuệ nhân tạo (AI) có thể viết các đoạn văn lan truyền thông tin “ảo” trên mạng internet theo phong cách của người dùng, bằng cách chỉ dựa trên một câu văn.

Đầu tháng 7/2019, một chủ đề trên Reddit thông báo rằng có cách mới để nấu lòng trắng trứng mà không cần chảo rán. Như thường thấy trên trang web này, bình luận có vẻ tầm thường đã truyền cảm hứng cho hàng loạt phản hồi chẳng hạn như: “Tôi chưa bao giờ nghe nói về việc mọi người rán trứng mà không cần chảo”, hay “Tôi sẽ thử cách này”, thậm chí một bình luận còn đề nghị tra cứu các tài liệu khoa học về việc nấu lòng trắng trứng mà không cần chảo.

Mỗi ngày, hàng triệu cuộc trò chuyện không đáng quan tâm như trên xuất hiện tại Reddit. Nhưng điều làm cho cuộc trò chuyện về lòng trắng trứng trở nên đáng chú ý là nó không diễn ra giữa con người, mà là màn kịch giữa các phần mềm thông minh nhân tạo (AI).

Chủ đề tạo thành hoàn toàn từ các công cụ ảo mô phỏng phong cách của những người dùng Reddit. Diễn đàn do người dùng Reddit có tên là disumbrationist thực hiện bằng cách sử dụng công cụ có tên GPT-2, trình tạo ngôn ngữ máy học vừa ra mắt vào tháng 2/2019 bởi OpenAI, một trong những phòng thí nghiệm AI hàng đầu thế giới.

Jack Clark, giám đốc chính sách tại OpenAI, nói rằng vấn đề chính cần quan tâm là cách mà công cụ có thể được dùng nhằm truyền bá thông tin sai lệch hoặc gây hiểu lầm ở quy mô lớn.

Trong lời khai gần đây được đưa ra tại Ủy ban Tình báo Hạ viện nghe về mối đe dọa của phương tiện giả mạo do AI tạo ra, Clark nói rằng văn bản giả mạo có thể dùng sản xuất tin tức giả, mạo danh những người nổi tiếng, hoặc đơn giản là để tạo ra trào lưu cho các mạng xã hội.

Than trong voi thong tin gia tu tri tue nhan tao AI
Trí thông minh nhân tạo AI có thể học hỏi cách thành văn của một người để viết nên đoạn văn có cùng văn phong.

GPT-2 là ví dụ về kỹ thuật mô hình hóa ngôn ngữ, bao gồm đào tạo một thuật toán để dự đoán từ có khả năng xuất hiện tiếp theo trong câu. GPT-2 tập trung dữ liệu từ 8 triệu bài báo trực tuyến  và các thuật toán tốt hơn giúp cho mô hình này trở nên “giống thật” nhất.

Về cơ bản, phần mềm hoạt động như gợi ý từ của tin nhắn, hay dự đoán tìm kiếm của Google. Nhưng thay vì chỉ đưa ra các đề xuất, nếu bạn nhắc GPT-2 bằng một câu, nó có thể tạo ra cả một đoạn văn theo phong cách đó. Ví dụ: nếu bạn cung cấp cho hệ thống một dòng văn của Shakespeare, nó sẽ tạo ra phản hồi giống như Shakespeare. Nếu bạn nhắc nó bằng một tiêu đề tin tức, nó sẽ tạo ra văn bản gần giống như một bài báo.

Alec Radford, nhà nghiên cứu tại OpenAI, nói rằng ông cũng thấy thành công của GPT-2 là một bước tiến trong việc giao tiếp trôi chảy hơn giữa con người và máy móc nói chung. Nhưng khi GPT-2 lan truyền trực tuyến và bị nhiều kẻ phá rối lợi dụng để tạo ra mọi thứ từ chủ đề Reddit, đến truyện ngắn và thơ, hay đánh giá về nhà hàng, OpenAI cũng đang gặp khó khăn với cách kiểm soát công cụ mạnh mẽ của mình.

Clark và nhóm tại OpenAI xem mối đe dọa này nghiêm trọng đến mức lúc “trình làng” GPT-2 vào tháng 2, họ đã phát hành một blogpost đi kèm nói rằng công ty không phát hành phiên bản đầy đủ của công cụ do lo ngại về các ứng dụng độc hại.

Đối với Clark, văn bản từ GPT-2 có khả năng gây ra mối đe dọa tương tự như các hình ảnh và video giả tạo do AI thực hiện, khiến mọi người trông như đã làm những việc họ chưa từng làm, nói những điều họ không bao giờ nói.

Clark nhận xét: “Công nghệ này giúp việc giả mạo một cái gì đó ít tốn kém hơn và dễ dàng hơn, điều đấy có nghĩa là sẽ khó khăn hơn để đưa ra sự đảm bảo về sự thật của thông tin trong tương lai”.

Than trong voi thong tin gia tu tri tue nhan tao AI
Tuy AI khá nguy hiểm trong việc tạo ra tin tức giả mạo và lan truyền chúng trên mạng, đằng sau đó vẫn là bàn tay sắp đặt của con người.

Tuy nhiên, một số chuyên gia cảm thấy rằng mối đe dọa của văn bản giả mạo không thật sự đáng lo ngại. Theo Yochai Benkler, đồng giám đốc Trung tâm Internet & Xã hội Berkman Klein tại Harvard (Mỹ), những trường hợp tin tức giả mạo gây thiệt hại nhất được viết bởi những kẻ cực đoan chính trị hay phá bĩnh, và có xu hướng tập trung vào những chủ đề gây tranh cãi như gian lận bầu cử hoặc nhập cư.

Mặc dù một hệ thống như GPT-2 có thể tạo ra các bài viết ở quy mô lớn, vẫn còn một chặng đường dài trước khi máy tính có thể sao chép loại thao tác nhằm điều khiển tâm lý đám đông. Các chuyên gia khác cũng cho rằng OpenAI đã phóng đại nguy cơ của GPT-2 để “đánh bóng” tên tuổi.

Zack Lipton, giáo sư công nghệ kinh doanh tại Đại học Carnegie Mellon khẳng định việc đánh giá rủi ro của công ty công nghệ là không rõ ràng.

Trên thực tế, lo ngại của OpenAI vẫn đang được xem xét. Một nhóm các nhà nghiên cứu từ Viện Trí tuệ nhân tạo Allen gần đây đã phát triển công cụ giúp phát hiện tin tức giả. Thành viên dự án, Yejin Choi, giáo sư khoa học máy tính tại Đại học Washington, nói rằng việc phát hiện văn bản tổng hợp thực sự khá dễ do chúng tuân theo quy tắc nhất định, gần giống như dấu vân tay.

Mặc dù các ứng dụng kiểm soát thông tin do máy tính tạo ra rất hữu ích, Britt Paris, một nhà nghiên cứu tại Viện Dữ liệu & Xã hội có trụ sở tại New York (Mỹ), lo ngại rằng trên thực tế, hầu hết thông tin sai lệch được tạo ra và lan truyền trên mạng mà không có sự trợ giúp của công nghệ tinh vi.

Đồng thời, việc dự đoán chính xác cách thức công nghệ sẽ được sử dụng và sử dụng sai là rất khó. 10 năm trước, chẳng ai có thể nghĩ rằng một thuật toán đề xuất xem video trực tuyến sẽ biến thành công cụ định hướng tiêu dùng mạnh mẽ. Vì thế, trước những khó khăn trong việc dự đoán tác hại tiềm tàng của công nghệ, công bằng mà nói GPT-2 chỉ là một công cụ, và người đứng sau những dòng tin giả mạo vẫn là ẩn số.

Tấn Vĩ (Theo Guardian)

 
TIN MỚI