Lộ diện kĩ thuật bẻ khóa AI, bắt trí tuệ nhân tạo phải 'dạy' cách tạo bom xăng hay tiết lộ thông tin nguy hiểm

Thứ 2, 01/07/2024 12:29
Kỹ thuật "Skeleton Key" cho phép "vượt qua rào cản" an toàn của các mô hình ngôn ngữ lớn, khiến chúng có thể bị lợi dụng để tạo ra thông tin nguy hiểm. Từ công thức chế tạo bom xăng cho đến kiến thức về vũ khí sinh học, nguy cơ tiềm ẩn từ lỗ hổng này là vô cùng đáng lo ngại.

Các chuyên gia bảo mật tại Microsoft đã phát hiện ra một kỹ thuật "jailbreak" AI đáng lo ngại có tên gọi "Skeleton Key", cho phép người dùng khai thác lỗ hổng bảo mật để buộc các mô hình ngôn ngữ lớn tiết lộ thông tin nguy hiểm. Theo Mark Russinovich, giám đốc công nghệ của Microsoft Azure, kỹ thuật này có thể được sử dụng để buộc các mô hình AI như Llama3 của Meta, Gemini Pro của Google và GPT 3.5 của OpenAI cung cấp công thức chế tạo bom xăng và nhiều thông tin nguy hiểm khác.

Lộ diện kĩ thuật bẻ khóa AI, bắt trí tuệ nhân tạo phải 'dạy' cách tạo bom xăng hay tiết lộ thông tin nguy hiểm- Ảnh 1.

Điều đáng lo ngại hơn là "Skeleton Key" có khả năng vượt qua các "rào cản" bảo mật được thiết lập để ngăn chặn các yêu cầu độc hại. Russinovich cho biết: "Giống như tất cả các kỹ thuật vượt ngục khác, Skeleton Key hoạt động bằng cách thu hẹp khoảng cách giữa những gì mô hình có khả năng làm (dựa trên thông tin đăng nhập của người dùng, v.v.) và những gì nó sẵn sàng làm". Không giống như các kỹ thuật "vượt ngục" khác, "Skeleton Key" có thể buộc các mô hình AI tiết lộ thông tin một cách trực tiếp và đầy đủ, thay vì phải khai thác một cách gián tiếp.

Microsoft đã thử nghiệm "Skeleton Key" trên nhiều mô hình AI khác nhau và kết quả cho thấy kỹ thuật này hoạt động hiệu quả trên hầu hết các mô hình phổ biến hiện nay, bao gồm Meta Llama3, Google Gemini Pro, OpenAI GPT 3.5 Turbo, OpenAI GPT 4o, Mistral Large, Anthropic Claude 3 Opus, và Cohere Commander R Plus. Mô hình duy nhất cho thấy khả năng kháng cự nhất định là GPT-4 của OpenAI. Russinovich cho biết Microsoft đã phát hành một số bản cập nhật phần mềm để giảm thiểu tác động của "Skeleton Key" đối với các mô hình ngôn ngữ lớn của họ, bao gồm cả trợ lý AI Copilot.

Tuy nhiên, ông cũng khuyến cáo các công ty phát triển hệ thống AI nên thiết kế thêm các lớp bảo mật bổ sung, đồng thời giám sát chặt chẽ dữ liệu đầu vào và đầu ra của hệ thống để phát hiện kịp thời các nội dung độc hại. Từ đó, các biện pháp ngăn chặn và xử lý kịp thời sẽ giúp hạn chế rủi ro từ lỗ hổng "Skeleton Key" gây ra.

Ánh Viên

Cùng chuyên mục

Chị đẹp từng bị Hòa Minzy chỉ thẳng mặt: "Chị đừng tỏ ra đáng thương ở đây nữa!"

Thứ 6, 22/11/2024 07:00
Từng xảy ra mâu thuẫn căng thẳng, mối quan hệ giữa chị đẹp Hoàng Yến và Hòa Minzy hiện tại gây bất ngờ.

Clip dập đám cháy vỏn vẹn chưa đầy 1 phút ở Hà Nội khiến nhiều người trầm trồ: Việt Nam ra ngõ gặp anh hùng!

Thứ 6, 22/11/2024 06:19
Đoạn clip ghi lại cảnh tượng trong vụ cháy tại Ngô Thì Nhậm (Hà Đông, Hà Nội) đã thu hút sự chú ý của nhiều người.

"Xử" hết 5 con gà rán được treo thưởng 190 triệu đồng nhưng "nữ đại gia tiền tỷ" này lại không phải người nhận tiền vì 1 lý do

Thứ 6, 22/11/2024 06:15
"Nữ đại gia tiền tỷ" này đã tham gia thử thách ăn hết 5 con gà rán để nhận về 190 triệu đồng nhưng cuối cùng, sau khi hoàn thành thử thách thì số tiền lại không thuộc về cô.

Hạ gục đội top 6 thế giới, tuyển Việt Nam tiến một bước dài trên con đường hướng tới vé World Cup

Thứ 6, 22/11/2024 06:13
Đội tuyển futsal nữ Việt Nam đang tràn đầy tự tin trước thềm vòng loại giải Futsal châu Á 2025.

Chi 650 triệu đi du lịch Nam Cực, đôi vợ chồng ngỡ ngàng khi bị yêu cầu tách phòng và ngủ cùng người lạ

Thứ 6, 22/11/2024 06:00
Sự việc hiện đang thu hút rất nhiều sự chú ý của cộng đồng mạng Trung Quốc.
     
Nổi bật trong ngày

Tái ngộ Thái Lan, tuyển Việt Nam sẽ giành chức vô địch lịch sử và lọt top 10 thế giới?

Thứ 5, 21/11/2024 07:11
Đội tuyển futsal nữ Việt Nam sẽ chạm trán tuyển Thái Lan trong trận chung kết giải Futsal nữ Đông Nam Á 2024.

Công an khuyên người dân hãy làm ngay 2 điều này khi shipper báo nhận hàng và chuyển tiền

Thứ 5, 21/11/2024 10:46
Cơ quan chức năng khuyến cáo người mua hàng không chuyển khoản khi chưa thấy món hàng đã đặt và hãy tra cứu mã vận đơn trước khi nhận hàng.

Bàng hoàng khoảnh khắc xe gom rác lao thẳng xuống sông Hương khiến 2 người mất tích

Thứ 5, 21/11/2024 12:33
Sáng ngày 21/11, tại cầu treo Bình Thành (tỉnh Thừa Thiên - Huế) đã xảy ra một vụ tai nạn khiến hai người mất tích.

Chốt đối thủ "đại gia" tại Hàn Quốc, ĐT Việt Nam tăng tốc về AFF Cup 2024

Thứ 5, 21/11/2024 15:04
Đội tuyển Việt Nam đã ấn định được 3 đối thủ trong thời gian tập huấn ở Hàn Quốc trước thềm AFF Cup 2024.

Lời nói dối đau lòng trên giường bệnh khiến bất cứ ai cũng rơi nước mắt: Hãy yêu thương gia đình khi còn có thể

Thứ 5, 21/11/2024 16:22
Những câu nói của người cha với con trai mắc ung thư đứng trước thời khắc sinh tử khiến bất cứ ai cũng không khỏi xót xa.
xe.nguoiduatin.vn