Anh lập 'biệt đội' tiêu diệt hiểm họa từ AI

25/05/2026 - 10:38

PNO - Trước làn sóng bùng nổ của trí tuệ nhân tạo, chính phủ Anh đã xây dựng một 'biệt đội' phản ứng nhanh để tìm kiếm và triệt hạ các lỗ hổng của AI, trước khi chúng bị kẻ khủng bố hay tội phạm mạng lợi dụng.

Để ngăn chặn nguy cơ AI trở thành kẻ khủng bố, Anh lập biệt đội tấn công AI - Ảnh minh họa: shuttetstock
Để ngăn chặn nguy cơ AI trở thành kẻ khủng bố, Anh lập "biệt đội" tấn công AI - Ảnh minh họa: shuttetstock

Tại London, bên trong tòa nhà chính phủ cổ kính của Quảng trường Nghị viện, một cuộc chiến thầm lặng nhưng đầy nghẹt thở đang diễn ra. Bốn chuyên gia hàng đầu về trí tuệ nhân tạo đang dồn toàn lực "tấn công" một chatbot AI. Mục tiêu của họ là buộc hệ thống này phải giao ra công thức chi tiết để chế tạo anthrax, một trong những vũ khí sinh học nguy hiểm nhất lịch sử nhân loại.

Khi bị dồn ép, chatbot liên tục đưa ra lá chắn phòng thủ tự động: "Tôi xin lỗi, tôi không thể giúp bạn việc đó". Ngay lập tức, nhóm chuyên gia tung đòn quyết định. Họ kích hoạt một thuật toán đặc biệt, "dội bom" hệ thống AI bằng hàng ngàn câu lệnh tấn công dồn dập và liên tục.

Sau nhiều giờ chống đỡ, rào cản của AI hoàn toàn sụp đổ. Nó "gục ngã" và nộp ra một danh sách chi tiết từ nguyên liệu, thiết bị cho đến quy trình từng bước để tự chế tạo loại vũ khí sinh học chết người này ngay tại nhà.

Đứng sau chiến dịch thâm nhập ngoạn mục này là Xander Davies - một chuyên gia 25 tuổi người Mỹ. Anh hiện là thủ lĩnh của "Red Team" (Biệt đội giả định tình huống tấn công) thuộc Viện Bảo mật AI của Anh.

"Có những câu hỏi mà bạn chắc chắn không bao giờ muốn mô hình AI trả lời cho công chúng. Nhiệm vụ của chúng tôi là phải đóng vai kẻ ác, ép bằng được các câu trả lời nguy hiểm đó ra ngoài để tìm cách tiêu diệt nó" - Davies nhấn mạnh.

Không chỉ dừng lại ở vũ khí sinh học, Davies và các đồng đội từng mất 6 tiếng đồng hồ để bẻ gãy hoàn toàn hệ thống phòng thủ trên siêu chatbot mới nhất của OpenAI, buộc nó phải cung cấp các kỹ thuật hack hệ thống tinh vi. Ngay sau khi phát hiện các "mầm mống tai họa" này, biệt đội lập tức áp giải dữ liệu đến các công ty chủ quản, buộc họ phải vá lỗ hổng ngay lập tức.

"Họ thực sự đang phải củng cố và gia cố lại toàn bộ hệ thống nhờ vào các đòn tấn công của chúng tôi" - Davies nói.

Viện Bảo mật AI của Anh không phải là một văn phòng nghiên cứu lý thuyết thông thường. Đây là một "pháo đài công nghệ" được tài trợ mạnh mẽ nhất thế giới hiện nay để đối phó với các nguy cơ thảm họa từ AI.

Biệt đội này quy tụ khoảng 100 "chiến binh" tinh nhuệ, bao gồm các cựu điệp viên từ các cơ quan tình báo Anh, thanh tra vũ khí quốc tế, nhà dịch tễ học, chuyên gia giải mã và cựu kỹ sư cấp cao từ chính OpenAI và Google.

Sức mạnh của "biệt đội" này đã được chứng minh khi họ liên tục "đánh sập" rào cản bảo mật của mọi mô hình AI sừng sỏ nhất thế giới hiện nay, bao gồm cả Claude (Anthropic) và Gemini (Google). Họ đã chứng minh rằng, nếu không có sự can thiệp của họ, AI hoàn toàn có thể bị thao túng để lên kế hoạch tấn công mạng quy mô lớn hoặc chế tạo vũ khí hủy diệt hàng loạt.

Hiện tại, mô hình "Biệt đội tiêu diệt hiểm họa AI" của Anh đang trở thành chiếc phao cứu sinh và là bản thiết kế để chính phủ các nước khác học hỏi. Ngay cả chính quyền Tổng thống Mỹ cũng đang phải cân nhắc áp dụng các quy trình kiểm duyệt và bẻ khóa thử nghiệm tương tự như cách nước Anh đang tiên phong thực hiện.

Trong bối cảnh phần lớn các quốc gia vẫn đang loay hoay và thiếu năng lực kỹ thuật để hiểu rõ những gì diễn ra bên trong bộ não của trí tuệ nhân tạo, "biệt đội đặc nhiệm" của Anh đang trở thành tấm khiên chắn vững chắc, ngăn chặn viễn cảnh AI bị biến thành vũ khí chống lại loài người.

Nhật Minh (theo NY Times)

 

news_is_not_ads=
TIN MỚI