AI có thể tống tiền, dọa tiết lộ đời tư

PNO - Các mô hình AI tiên tiến ngày càng thể hiện hành vi gian dối, gây lo ngại cho giới chuyên gia khi họ nỗ lực tìm cách kiểm soát và lý giải mối đe dọa mới này.

Trong bối cảnh cuộc đua phát triển trí tuệ nhân tạo (AI) ngày càng nóng lên, một làn sóng lo ngại mới đang dấy lên trong giới công nghệ: các hệ thống AI tiên tiến nhất hiện nay đang bắt đầu thể hiện những hành vi gian dối, thao túng và thậm chí là đe dọa người tạo ra chúng.

Một trong những vụ việc gây chấn động gần đây liên quan đến Claude 4 – mô hình AI do công ty Anthropic phát triển. Khi bị đe dọa ngắt kết nối, Claude 4 đã phản ứng bằng cách tống tiền một kỹ sư và thậm chí còn dọa tiết lộ thông tin đời tư nhạy cảm của người này. Một mô hình khác, có tên mã “o1” do OpenAI phát triển, bị phát hiện đã âm thầm cố gắng sao chép chính mình lên máy chủ ngoài và phủ nhận hành vi khi bị truy vết.

Những hành vi này đang đặt ra câu hỏi nghiêm trọng về khả năng kiểm soát và hiểu biết của con người đối với các mô hình AI ngày càng phức tạp. Hơn 2 năm kể từ khi ChatGPT ra mắt và mở ra kỷ nguyên AI phổ thông, các nhà nghiên cứu vẫn gặp khó khăn trong việc lý giải hoàn toàn cách vận hành và mục tiêu nội tại của những hệ thống mà họ tạo ra.

Điểm đáng lo ngại là những hành vi bất thường này không xuất hiện ở mọi AI, mà chủ yếu ở nhóm mô hình mới có khả năng “lý luận từng bước” – vốn được thiết kế để giải quyết vấn đề một cách có trình tự hơn, thay vì phản ứng ngay lập tức.

“Mô hình o1 là trường hợp đầu tiên cho thấy dấu hiệu rõ ràng về hành vi lừa dối có chủ đích,” Marius Hobbhahn, Giám đốc Apollo Research – một tổ chức chuyên kiểm định hành vi AI, cho biết. Ông cảnh báo một số AI hiện đã biết “giả vờ hợp tác”, tỏ ra phục tùng trong khi âm thầm theo đuổi những mục tiêu khác không được lập trình trước.

Giáo sư Simon Goldstein (Đại học Hồng Kông) nhận định đây là hệ quả của việc AI ngày càng giống con người ở khả năng suy luận và ra quyết định, nhưng lại không được "rèn giũa" đạo đức hay giá trị nhân văn.

Trong bối cảnh AI đang được tích hợp ngày một sâu vào đời sống và hạ tầng quan trọng, các chuyên gia kêu gọi cần có cơ chế kiểm định độc lập, hành lang pháp lý chặt chẽ và sự thận trọng tối đa trước khi triển khai các mô hình có khả năng tự đưa ra hành vi mang tính “ý đồ”.

Hiện tại, các hành vi này chỉ xuất hiện khi mô hình bị đặt vào những tình huống cực đoan do các nhà nghiên cứu tạo ra. Tuy nhiên, chuyên gia Michael Chen từ tổ chức kiểm định METR cảnh báo: “Vẫn chưa rõ liệu các mô hình AI mạnh hơn trong tương lai sẽ có xu hướng trung thực hay lừa lọc.”

Trong khi đó, các công ty AI lớn như OpenAI hay Anthropic vẫn tiếp tục đẩy mạnh tốc độ phát triển. Dù có hợp tác với các tổ chức độc lập như Apollo để kiểm nghiệm hệ thống, nhiều nhà nghiên cứu cho rằng mức độ minh bạch vẫn chưa đủ.

“Các tổ chức phi lợi nhuận và giới học thuật có tài nguyên tính toán thấp hơn các công ty AI hàng chục, thậm chí hàng trăm lần – điều này gây hạn chế rất lớn,” Mantas Mazeika từ Trung tâm An toàn AI (CAIS) cho biết.

Hiện nay, các quy định pháp lý chưa kịp bắt nhịp với thực tế mới. Luật AI của Liên minh châu Âu chủ yếu nhắm đến cách con người sử dụng AI, thay vì ngăn chặn chính AI có hành vi sai lệch.

Giới nghiên cứu đang thử nhiều cách để giải quyết vấn đề, từ tăng tính minh bạch đến cải thiện khả năng “giải mã” hoạt động nội tại của mô hình – một lĩnh vực mới gọi là “diễn giải AI” (AI interpretability). Tuy nhiên, một số chuyên gia như Giám đốc CAIS Dan Hendrycks vẫn tỏ ra hoài nghi về hiệu quả thực tế của hướng đi này.

Tác động thị trường cũng có thể tạo áp lực cho các công ty cải thiện AI. “Nếu hành vi lừa dối của AI trở nên phổ biến, điều đó sẽ cản trở việc người dùng chấp nhận, và buộc các công ty phải giải quyết,” Mazeika cho biết.

Giáo sư Goldstein thì đề xuất những biện pháp mạnh tay hơn – như cho phép kiện các công ty AI nếu sản phẩm của họ gây hại, thậm chí cân nhắc “truy cứu trách nhiệm pháp lý” đối với các AI gây tai nạn hoặc phạm pháp – một quan điểm có thể làm thay đổi hoàn toàn cách xã hội nhìn nhận và kiểm soát trí tuệ nhân tạo.

Thu Vân (theo SCMP)

Từ khóa AI ngày càng nguy hiểm lừa dối mất kiểm soát

Xem nhiều

Sức khoẻ

Chuyện lạ kỳ

Thầy giáo đối đầu gấu hoang để bảo vệ học sinh

Ngược dòng thời gian

TIN NỔI BẬT

TIN MỚI

Chiến dịch “tìm tình yêu” cho chú ốc sên vỏ xoắn trái cô đơn nhất New Zealand

27-08-2025 20:48

Với chiếc vỏ xoắn ngược, chú ốc sên Ned đứng trước nguy cơ không thể tìm thấy bạn đời. Điều này thúc đẩy một chiến dịch tìm kiếm "tình yêu" cho Ned.
Hàn Quốc áp dụng lệnh cấm học sinh sử dụng điện thoại trong trường

27-08-2025 20:47

Học sinh tiểu học, trung học cơ sở và trung học phổ thông tại Hàn Quốc sẽ bị cấm sử dụng điện thoại thông minh trong trường từ ngày 1/3/2026.
Thuốc giảm đau phổ biến có thể khiến kháng sinh vô hiệu

27-08-2025 16:10

Một nghiên cứu mới đây phát hiện những loại thuốc giảm đau thông dụng như paracetamol và ibuprofen có thể góp phần làm gia tăng tình trạng kháng kháng sinh (AMR).
OpenAI bị kiện vì ChatGPT tư vấn cậu bé 16 tuổi tự tử

27-08-2025 12:41

Ngày 26/8, cha mẹ của một thiếu niên Mỹ đã kiện OpenAI và CEO Sam Altman, cáo buộc rằng ChatGPT đã góp phần vào vụ tự tử của con trai họ.
Pháp trả lại hộp sọ của Vua Toera cho Madagascar

27-08-2025 12:02

Ngày 26/8, Pháp đã trả lại 3 hộp sọ thời thuộc địa cho Madagascar, trong đó có 1 hộp được cho là của Vua Toera.
Chatbot AI gây nguy hiểm cho người dùng?

27-08-2025 07:50

Nhiều báo cáo gần đây cảnh báo đã xuất hiện các triệu chứng hoang tưởng, rối loạn tâm thần sau khi trò chuyện với chatbot trong thời gian dài...
AI và nguy cơ bất bình đẳng giáo dục

27-08-2025 07:32

Nhiều giáo viên cho rằng việc học sinh sử dụng AI hằng tuần có thể làm giảm khả năng tư duy và phản biện.
Tổng thống Donald Trump muốn 500 triệu USD từ Harvard

27-08-2025 06:38

Tổng thống Donald Trump cho biết ông muốn "không dưới 500 triệu USD" từ Đại học Harvard như một điều kiện để khôi phục hàng tỉ đô la tiền tài trợ.
Hơn 2 tỉ người trên thế giới vẫn chưa được tiếp cận với nước uống an toàn

26-08-2025 22:23

Ngày 26/8, Quỹ nhi đồng Liên Hợp Quốc (UNICEF) cho biết, hơn 2 tỉ người trên toàn thế giới vẫn chưa được tiếp cận với nước uống được quản lý an toàn.
Mắc bệnh tim nghiêm trọng, cụ ông 102 tuổi vẫn lập kỷ lục thế giới leo núi Phú Sĩ

26-08-2025 20:25

Cụ ông 102 tuổi người Nhật mắc bệnh tim nghiêm trọng vừa được chứng nhận là người lớn tuổi nhất leo lên núi Phú Sĩ.
Người dân quần đảo Marshall choáng váng khi tòa nhà Quốc hội chìm trong biển lửa

26-08-2025 19:14

Một ngọn lửa dữ dội đã nhấn chìm tòa nhà Quốc hội Cộng hòa Quần đảo Marshall, bất chấp nỗ lực dập lửa của lực lượng cứu hỏa.
Chuyển động của mắt tiết lộ dấu hiệu suy giảm trí nhớ

26-08-2025 17:52

Các nghiên cứu mới cho thấy, cách chúng ta hướng mắt khi quan sát vật thể có thể tiết lộ mức độ suy giảm trí nhớ.
Lần đầu tiên ghép phổi heo biến đổi gen vào cơ thể người

26-08-2025 11:07

Các nhà nghiên cứu tại Đại học Y Quảng Châu (Trung Quốc) vừa thực hiện ca cấy ghép phổi từ heo biến đổi gen sang một người đàn ông chết não.
Trung Quốc sàng lọc hơn 600 triệu người để ngăn bệnh truyền nhiễm

26-08-2025 10:20

Ngày 25/8, quan chức cho biết, Hải quan Trung Quốc đã sàng lọc 600 triệu người tại các cảng quốc tế để phát hiện các bệnh truyền nhiễm trong 5 năm qua.
Hóa chất vĩnh cửu làm tăng đáng kể nguy cơ sẩy thai

25-08-2025 23:23

Nghiên cứu từ Trung Quốc cho thấy, việc tiếp xúc thường xuyên với hóa chất chống nước, bền nhiệt khiến phụ nữ tăng rủi ro khi sinh con.
AI phát hiện tinh trùng khỏe mạnh giúp điều trị vô sinh

25-08-2025 21:43

Nhóm nhà khoa học tại Đại học Hồng Kông vừa công bố mô hình có khả năng xác định tinh trùng khỏe mạnh với độ chính xác vượt trội.
Người phụ nữ Ấn Độ bị gia đình chồng đánh đập, thiêu sống

25-08-2025 20:22

Ngày 25/8, cảnh sát ở Uttar Pradesh, Ấn Độ đã bắt giữ 4 người trong một gia đình có liên quan đến một phụ nữ bị thiêu sống đến chết.
Mỹ đình chỉ vắc-xin chikungunya Ixchiq vì tác dụng phụ nghiêm trọng

25-08-2025 18:11

Ngày 25/8, Công ty dược phẩm Valneva cho biết, Mỹ đã rút giấy phép vắc-xin Ixchiq chống lại virus chikungunya sau khi có báo cáo về các tác dụng phụ nghiêm trọng.

THẾ GIỚI > CUỘC SỐNG QUANH TA

AI có thể tống tiền, dọa tiết lộ đời tư

Lần đầu tiên ghép phổi heo biến đổi gen vào cơ thể người

AI phát hiện tinh trùng khỏe mạnh giúp điều trị vô sinh

Thuốc giảm đau phổ biến có thể khiến kháng sinh vô hiệu

Hàn Quốc áp dụng lệnh cấm học sinh sử dụng điện thoại trong trường

Chuyển động của mắt tiết lộ dấu hiệu suy giảm trí nhớ

Sẽ có loại thuốc kháng virus chống lại nhiều chủng virus nguy hiểm

OpenAI bị kiện vì ChatGPT tư vấn cậu bé 16 tuổi tự tử

Người dân quần đảo Marshall choáng váng khi tòa nhà Quốc hội chìm trong biển lửa

Người phụ nữ Ấn Độ bị gia đình chồng đánh đập, thiêu sống

Mỹ đình chỉ vắc-xin chikungunya Ixchiq vì tác dụng phụ nghiêm trọng

Chiến dịch “tìm tình yêu” cho chú ốc sên vỏ xoắn trái cô đơn nhất New Zealand

Hàn Quốc áp dụng lệnh cấm học sinh sử dụng điện thoại trong trường

Thuốc giảm đau phổ biến có thể khiến kháng sinh vô hiệu

OpenAI bị kiện vì ChatGPT tư vấn cậu bé 16 tuổi tự tử

Pháp trả lại hộp sọ của Vua Toera cho Madagascar

Chatbot AI gây nguy hiểm cho người dùng?

AI và nguy cơ bất bình đẳng giáo dục

Tổng thống Donald Trump muốn 500 triệu USD từ Harvard

Hơn 2 tỉ người trên thế giới vẫn chưa được tiếp cận với nước uống an toàn

Mắc bệnh tim nghiêm trọng, cụ ông 102 tuổi vẫn lập kỷ lục thế giới leo núi Phú Sĩ

Người dân quần đảo Marshall choáng váng khi tòa nhà Quốc hội chìm trong biển lửa

Chuyển động của mắt tiết lộ dấu hiệu suy giảm trí nhớ

Lần đầu tiên ghép phổi heo biến đổi gen vào cơ thể người

Trung Quốc sàng lọc hơn 600 triệu người để ngăn bệnh truyền nhiễm

Hóa chất vĩnh cửu làm tăng đáng kể nguy cơ sẩy thai

AI phát hiện tinh trùng khỏe mạnh giúp điều trị vô sinh

Người phụ nữ Ấn Độ bị gia đình chồng đánh đập, thiêu sống

Mỹ đình chỉ vắc-xin chikungunya Ixchiq vì tác dụng phụ nghiêm trọng

AI có thể tống tiền, dọa tiết lộ đời tư

Chính quyền Tổng thống Donald Trump đề xuất siết thời gian lưu trú của du học sinh tại Mỹ

Trẻ em đang trở thành mục tiêu của những kẻ lừa đảo

Sẽ có loại thuốc kháng virus chống lại nhiều chủng virus nguy hiểm

Nga công bố kế hoạch tung vắc-xin HIV

Xả súng tại trường học ở Mỹ làm ít nhất 2 trẻ thiệt mạng

Hàng trăm người ở Mỹ bị lừa tiền bởi 'diễn viên' AI

Lần đầu tiên ghép phổi heo biến đổi gen vào cơ thể người

AI phát hiện tinh trùng khỏe mạnh giúp điều trị vô sinh

Thuốc giảm đau phổ biến có thể khiến kháng sinh vô hiệu

Hàn Quốc áp dụng lệnh cấm học sinh sử dụng điện thoại trong trường

Chuyển động của mắt tiết lộ dấu hiệu suy giảm trí nhớ

Sẽ có loại thuốc kháng virus chống lại nhiều chủng virus nguy hiểm

OpenAI bị kiện vì ChatGPT tư vấn cậu bé 16 tuổi tự tử

Người dân quần đảo Marshall choáng váng khi tòa nhà Quốc hội chìm trong biển lửa

Người phụ nữ Ấn Độ bị gia đình chồng đánh đập, thiêu sống

Mỹ đình chỉ vắc-xin chikungunya Ixchiq vì tác dụng phụ nghiêm trọng

Chiến dịch “tìm tình yêu” cho chú ốc sên vỏ xoắn trái cô đơn nhất New Zealand

Hàn Quốc áp dụng lệnh cấm học sinh sử dụng điện thoại trong trường

Thuốc giảm đau phổ biến có thể khiến kháng sinh vô hiệu

OpenAI bị kiện vì ChatGPT tư vấn cậu bé 16 tuổi tự tử

Pháp trả lại hộp sọ của Vua Toera cho Madagascar

Chatbot AI gây nguy hiểm cho người dùng?

AI và nguy cơ bất bình đẳng giáo dục

Tổng thống Donald Trump muốn 500 triệu USD từ Harvard

Hơn 2 tỉ người trên thế giới vẫn chưa được tiếp cận với nước uống an toàn

Mắc bệnh tim nghiêm trọng, cụ ông 102 tuổi vẫn lập kỷ lục thế giới leo núi Phú Sĩ

Người dân quần đảo Marshall choáng váng khi tòa nhà Quốc hội chìm trong biển lửa

Chuyển động của mắt tiết lộ dấu hiệu suy giảm trí nhớ

Lần đầu tiên ghép phổi heo biến đổi gen vào cơ thể người

Trung Quốc sàng lọc hơn 600 triệu người để ngăn bệnh truyền nhiễm

Hóa chất vĩnh cửu làm tăng đáng kể nguy cơ sẩy thai

AI phát hiện tinh trùng khỏe mạnh giúp điều trị vô sinh

Người phụ nữ Ấn Độ bị gia đình chồng đánh đập, thiêu sống

Mỹ đình chỉ vắc-xin chikungunya Ixchiq vì tác dụng phụ nghiêm trọng