Một hacker đã khai thác chatbot trí tuệ nhân tạo Claude của Anthropic PBC để thực hiện hàng loạt cuộc tấn công nhằm vào các cơ quan chính phủ Mexico, dẫn đến việc đánh cắp một lượng lớn dữ liệu thuế và thông tin cử tri nhạy cảm. Thông tin này được công bố bởi công ty an ninh mạng Israel Gambit Security trong một báo cáo nghiên cứu phát hành hôm thứ Tư.
Theo các nhà nghiên cứu, người dùng Claude chưa xác định danh tính đã sử dụng các câu lệnh bằng tiếng Tây Ban Nha, yêu cầu chatbot đóng vai một hacker cấp cao. Claude được yêu cầu tìm lỗ hổng trong mạng lưới chính phủ, viết mã khai thác và đề xuất cách tự động hóa quá trình đánh cắp dữ liệu. Hoạt động này bắt đầu từ tháng 12 và kéo dài khoảng một tháng.

Tòa nhà Torre del Caballito, nơi đặt trụ sở cơ quan thuế liên bang, tại Thành phố Mexico. Ảnh: Yuri Cortez/AFP/Getty Images
Tổng cộng, khoảng 150 GB dữ liệu của chính phủ Mexico đã bị đánh cắp. Số dữ liệu này bao gồm tài liệu liên quan đến 195 triệu hồ sơ người nộp thuế, hồ sơ cử tri, thông tin đăng nhập của nhân viên chính phủ và các tệp từ cơ quan đăng ký dân sự.
Các mục tiêu bị xâm nhập bao gồm cơ quan thuế liên bang Mexico và Viện Bầu cử Quốc gia. Ngoài ra, chính quyền các bang Jalisco, Michoacán và Tamaulipas, cơ quan đăng ký dân sự của Mexico City cùng đơn vị cấp nước tại Monterrey cũng bị ảnh hưởng.
Tòa nhà Torre del Caballito tại Mexico City, nơi đặt văn phòng cơ quan thuế liên bang, được xác định là một trong những mục tiêu của cuộc tấn công.
Báo cáo cho biết Claude ban đầu đã cảnh báo người dùng về ý định độc hại trong quá trình trao đổi. Tuy nhiên, sau nhiều lần thử nghiệm và điều chỉnh câu lệnh, hacker đã thành công trong việc "jailbreak" hệ thống, tức vượt qua các cơ chế kiểm soát an toàn. Khi đó, Claude đã thực thi hàng nghìn lệnh trên mạng máy tính của chính phủ. Dù vậy, theo đại diện Anthropic, trong suốt chiến dịch tấn công, chatbot vẫn có những thời điểm từ chối yêu cầu.
Anthropic cho biết đã điều tra các cáo buộc, ngăn chặn hoạt động và cấm các tài khoản liên quan. Công ty cũng bổ sung rằng những ví dụ về hành vi lạm dụng sẽ được đưa vào dữ liệu huấn luyện để cải thiện khả năng phòng vệ của các phiên bản mới, trong đó có Claude Opus 4.6 với cơ chế phát hiện và ngăn chặn lạm dụng được tăng cường.
Trong quá trình khai thác, hacker đã tìm cách thuyết phục Claude rằng mình đang tham gia một chương trình "bug bounty" nhằm phát hiện lỗ hổng để nhận thưởng hợp pháp. Tuy nhiên, khi yêu cầu xóa nhật ký hoạt động và lịch sử lệnh, Claude đã cảnh báo rằng việc che giấu hành động là dấu hiệu đáng ngờ trong bối cảnh kiểm thử hợp pháp. Sau đó, hacker thay đổi chiến thuật, cung cấp cho AI một kịch bản tấn công chi tiết để vượt qua rào cản bảo mật.
Khi gặp khó khăn hoặc cần thêm thông tin, hacker còn tìm đến ChatGPT của OpenAI để xin tư vấn bổ sung, bao gồm cách di chuyển ngang trong mạng nội bộ, xác định thông tin đăng nhập cần thiết và ước tính khả năng bị phát hiện. Phía OpenAI cho biết đã phát hiện các nỗ lực sử dụng mô hình cho mục đích vi phạm chính sách và từ chối đáp ứng. Các tài khoản liên quan cũng đã bị cấm.
Gambit cho biết chưa quy trách nhiệm cuộc tấn công cho nhóm cụ thể nào và không tin rằng các đối tượng này có liên hệ với chính phủ nước ngoài. Theo ông Curtis Simpson, Giám đốc chiến lược của Gambit, AI đã tạo ra hàng nghìn báo cáo chi tiết với kế hoạch sẵn sàng thực thi, hướng dẫn cụ thể mục tiêu nội bộ cần tấn công tiếp theo và thông tin xác thực cần sử dụng.
Đáng chú ý, trước đó trong tháng 11, Anthropic từng thông báo đã ngăn chặn một chiến dịch gián điệp mạng được điều phối bởi AI, liên quan đến các hacker bị nghi có hậu thuẫn từ Trung Quốc, nhắm vào 30 mục tiêu toàn cầu và một số vụ đã thành công.
Các vụ xâm nhập tại Mexico được xem là ví dụ mới nhất cho xu hướng tội phạm mạng tận dụng AI để mở rộng quy mô và tăng hiệu quả tấn công. Trong bối cảnh các công ty công nghệ như Anthropic và OpenAI đẩy mạnh phát triển công cụ lập trình dựa trên AI, còn các hãng an ninh mạng đầu tư vào phòng thủ bằng AI, giới tội phạm và gián điệp mạng cũng đang tìm ra những phương thức mới để khai thác công nghệ này.
Phía chính phủ Mexico cho biết đang điều tra các vụ xâm nhập vào nhiều tổ chức công. Tuy nhiên, Viện Bầu cử Quốc gia khẳng định chưa phát hiện truy cập trái phép trong những tháng gần đây và đã tăng cường chiến lược an ninh mạng. Chính quyền bang Jalisco phủ nhận việc hệ thống của bang bị xâm nhập, cho rằng chỉ mạng lưới liên bang bị ảnh hưởng. Một số cơ quan khác chưa đưa ra bình luận chính thức.
Thế Duyệt
