Lộ diện kĩ thuật bẻ khóa AI, bắt trí tuệ nhân tạo phải 'dạy' cách tạo bom xăng hay tiết lộ thông tin nguy hiểm

Thứ 2, 01/07/2024 12:29
Kỹ thuật "Skeleton Key" cho phép "vượt qua rào cản" an toàn của các mô hình ngôn ngữ lớn, khiến chúng có thể bị lợi dụng để tạo ra thông tin nguy hiểm. Từ công thức chế tạo bom xăng cho đến kiến thức về vũ khí sinh học, nguy cơ tiềm ẩn từ lỗ hổng này là vô cùng đáng lo ngại.

Các chuyên gia bảo mật tại Microsoft đã phát hiện ra một kỹ thuật "jailbreak" AI đáng lo ngại có tên gọi "Skeleton Key", cho phép người dùng khai thác lỗ hổng bảo mật để buộc các mô hình ngôn ngữ lớn tiết lộ thông tin nguy hiểm. Theo Mark Russinovich, giám đốc công nghệ của Microsoft Azure, kỹ thuật này có thể được sử dụng để buộc các mô hình AI như Llama3 của Meta, Gemini Pro của Google và GPT 3.5 của OpenAI cung cấp công thức chế tạo bom xăng và nhiều thông tin nguy hiểm khác.

Lộ diện kĩ thuật bẻ khóa AI, bắt trí tuệ nhân tạo phải 'dạy' cách tạo bom xăng hay tiết lộ thông tin nguy hiểm- Ảnh 1.

Điều đáng lo ngại hơn là "Skeleton Key" có khả năng vượt qua các "rào cản" bảo mật được thiết lập để ngăn chặn các yêu cầu độc hại. Russinovich cho biết: "Giống như tất cả các kỹ thuật vượt ngục khác, Skeleton Key hoạt động bằng cách thu hẹp khoảng cách giữa những gì mô hình có khả năng làm (dựa trên thông tin đăng nhập của người dùng, v.v.) và những gì nó sẵn sàng làm". Không giống như các kỹ thuật "vượt ngục" khác, "Skeleton Key" có thể buộc các mô hình AI tiết lộ thông tin một cách trực tiếp và đầy đủ, thay vì phải khai thác một cách gián tiếp.

Microsoft đã thử nghiệm "Skeleton Key" trên nhiều mô hình AI khác nhau và kết quả cho thấy kỹ thuật này hoạt động hiệu quả trên hầu hết các mô hình phổ biến hiện nay, bao gồm Meta Llama3, Google Gemini Pro, OpenAI GPT 3.5 Turbo, OpenAI GPT 4o, Mistral Large, Anthropic Claude 3 Opus, và Cohere Commander R Plus. Mô hình duy nhất cho thấy khả năng kháng cự nhất định là GPT-4 của OpenAI. Russinovich cho biết Microsoft đã phát hành một số bản cập nhật phần mềm để giảm thiểu tác động của "Skeleton Key" đối với các mô hình ngôn ngữ lớn của họ, bao gồm cả trợ lý AI Copilot.

Tuy nhiên, ông cũng khuyến cáo các công ty phát triển hệ thống AI nên thiết kế thêm các lớp bảo mật bổ sung, đồng thời giám sát chặt chẽ dữ liệu đầu vào và đầu ra của hệ thống để phát hiện kịp thời các nội dung độc hại. Từ đó, các biện pháp ngăn chặn và xử lý kịp thời sẽ giúp hạn chế rủi ro từ lỗ hổng "Skeleton Key" gây ra.

Ánh Viên

Cùng chuyên mục

Thiếu gia của tập đoàn Samsung thi đại học chỉ trả lời sai đúng 1 câu 

Thứ 6, 05/12/2025 12:16
Con trai của "đại công chúa Samsung" đạt thành tích sốc trong kỳ thi đại học Suneung nổi tiếng khắc nghiệt của Hàn Quốc.

2 cô gái thoát chết trong vụ cháy quán ăn ở TP.HCM: Phá cửa sau, ném gấu bông rồi nhảy từ độ cao 10m xuống đất

Thứ 6, 05/12/2025 12:14
Nhiều nhân chứng vụ cháy quán ăn ở TP.HCM cho biết, thời điểm xảy ra vụ việc có 2 nữ nhân viên quán phá cửa phía sau quán bún ốc, ném gấu bông xuống đất rồi nhảy từ độ cao khoảng 10m… Trong lúc cháy, người dân xung quanh nghe có nhiều tiếng nổ phát ra, người bên trong kêu cứu thất thanh.

Xuất hiện tình tiết bất ngờ vụ phóng hoả quán cà phê khiến 11 người tử vong ở Hà Nội

Thứ 6, 05/12/2025 11:52
Tại phiên xét xử Cao Văn Hùng - kẻ đổ xăng đốt quán cà phê khiến 11 người tử vong xuất hiện thêm tình tiết mới nên Hội đồng xét xử quyết định hoãn phiên tòa, trả hồ sơ điều tra bổ sung.

Người đàn ông đau "như đau đẻ", kêu gào đòi phẫu thuật ngay trong đêm: Lý do gây bất ngờ

Thứ 6, 05/12/2025 11:50
Trong quá trình thăm khám cấp cứu, bác sĩ Mai Văn Lực, Khoa Phẫu thuật Thận - Tiết niệu - Nam học, Bệnh viện E đã gặp không ít trường hợp đòi phẫu thuật ngay vì quá đau đớn.

Thi hành Lệnh cấm đi khỏi nơi cư trú đối với Nguyễn Thị Nhành

Thứ 6, 05/12/2025 11:47
Đối tượng Nguyễn Thị Nhành bị khởi tố để điều về hành vi "Gá bạc".
     
Nổi bật trong ngày

3 cách hiệu quả nhất để rửa sạch thuốc trừ sâu khỏi rau quả

Thứ 5, 04/12/2025 08:00
Thuốc trừ sâu “bám dai” trên rau củ và trái cây, ngay cả với hàng hữu cơ. Tìm hiểu cách rửa sạch hiệu quả để bảo vệ sức khỏe trong bài viết dưới đây.

Người phụ nữ gửi tiết kiệm 3,7 tỷ đồng, 5 năm sau tài khoản còn 0 đồng liền kiện ngân hàng, tòa tuyên bố: 1 bên phải bồi thường 4,4 tỷ đồng

Thứ 5, 04/12/2025 08:53
Không chỉ mất sạch tiền tiết kiệm, người phụ nữ Trung Quốc còn hoang mang hơn khi bị tố là kẻ lừa đảo.

Phát hiện 719kg ma túy đá ngụy trang trong mâm xôi đen, FBI họp báo khẩn

Thứ 5, 04/12/2025 10:40
Vụ việc đang thu hút sự chú ý lớn tại Mỹ.

Cảnh báo thủ đoạn lừa đảo tinh vi ngay trước Tết Nguyên đán: Gặp 4 dấu hiệu này, lập tức báo công an

Thứ 5, 04/12/2025 13:59
Thời gian gần đây, tình trạng lừa đảo tuyển dụng dịp cận Tết qua mạng xã hội, nếu thấy xuất hiện 4 dấu hiệu nhận biết sau thì người dân cần cảnh giác và báo công an khi phát hiện nghi vấn.

Sợ bị 'đánh úp' dưới đáy biển, hai nước NATO tung hạm đội săn ngầm, đối đầu trực diện Nga ở Đại Tây Dương

Thứ 5, 04/12/2025 15:25
Anh và Na Uy sẽ cử hơn một chục tàu chiến đi săn tàu ngầm Nga và bảo vệ cơ sở hạ tầng quan trọng ở Bắc Đại Tây Dương trong các cuộc tuần tra mới trong những năm tới.
xe.nguoiduatin.vn