Lộ diện kĩ thuật bẻ khóa AI, bắt trí tuệ nhân tạo phải 'dạy' cách tạo bom xăng hay tiết lộ thông tin nguy hiểm

Thứ 2, 01/07/2024 12:29
Kỹ thuật "Skeleton Key" cho phép "vượt qua rào cản" an toàn của các mô hình ngôn ngữ lớn, khiến chúng có thể bị lợi dụng để tạo ra thông tin nguy hiểm. Từ công thức chế tạo bom xăng cho đến kiến thức về vũ khí sinh học, nguy cơ tiềm ẩn từ lỗ hổng này là vô cùng đáng lo ngại.

Các chuyên gia bảo mật tại Microsoft đã phát hiện ra một kỹ thuật "jailbreak" AI đáng lo ngại có tên gọi "Skeleton Key", cho phép người dùng khai thác lỗ hổng bảo mật để buộc các mô hình ngôn ngữ lớn tiết lộ thông tin nguy hiểm. Theo Mark Russinovich, giám đốc công nghệ của Microsoft Azure, kỹ thuật này có thể được sử dụng để buộc các mô hình AI như Llama3 của Meta, Gemini Pro của Google và GPT 3.5 của OpenAI cung cấp công thức chế tạo bom xăng và nhiều thông tin nguy hiểm khác.

Lộ diện kĩ thuật bẻ khóa AI, bắt trí tuệ nhân tạo phải 'dạy' cách tạo bom xăng hay tiết lộ thông tin nguy hiểm- Ảnh 1.

Điều đáng lo ngại hơn là "Skeleton Key" có khả năng vượt qua các "rào cản" bảo mật được thiết lập để ngăn chặn các yêu cầu độc hại. Russinovich cho biết: "Giống như tất cả các kỹ thuật vượt ngục khác, Skeleton Key hoạt động bằng cách thu hẹp khoảng cách giữa những gì mô hình có khả năng làm (dựa trên thông tin đăng nhập của người dùng, v.v.) và những gì nó sẵn sàng làm". Không giống như các kỹ thuật "vượt ngục" khác, "Skeleton Key" có thể buộc các mô hình AI tiết lộ thông tin một cách trực tiếp và đầy đủ, thay vì phải khai thác một cách gián tiếp.

Microsoft đã thử nghiệm "Skeleton Key" trên nhiều mô hình AI khác nhau và kết quả cho thấy kỹ thuật này hoạt động hiệu quả trên hầu hết các mô hình phổ biến hiện nay, bao gồm Meta Llama3, Google Gemini Pro, OpenAI GPT 3.5 Turbo, OpenAI GPT 4o, Mistral Large, Anthropic Claude 3 Opus, và Cohere Commander R Plus. Mô hình duy nhất cho thấy khả năng kháng cự nhất định là GPT-4 của OpenAI. Russinovich cho biết Microsoft đã phát hành một số bản cập nhật phần mềm để giảm thiểu tác động của "Skeleton Key" đối với các mô hình ngôn ngữ lớn của họ, bao gồm cả trợ lý AI Copilot.

Tuy nhiên, ông cũng khuyến cáo các công ty phát triển hệ thống AI nên thiết kế thêm các lớp bảo mật bổ sung, đồng thời giám sát chặt chẽ dữ liệu đầu vào và đầu ra của hệ thống để phát hiện kịp thời các nội dung độc hại. Từ đó, các biện pháp ngăn chặn và xử lý kịp thời sẽ giúp hạn chế rủi ro từ lỗ hổng "Skeleton Key" gây ra.

Ánh Viên

Cùng chuyên mục

Tin vui mới cho người dùng điện thoại Samsung

Thứ 3, 10/03/2026 17:16
Người dùng dòng điện thoại Galaxy đời cũ có thể vui mừng với quyết định của Samsung.

Xấu hổ khi hỏi mua chai nước hoa chiết giá 400.000 đồng

Thứ 3, 10/03/2026 17:15
Chỉ một câu hỏi trong cửa hàng nước hoa chiều hôm đó khiến tôi đỏ mặt, muốn rời đi thật nhanh.

Chuyện tình đẹp nhất làng LMHT xứ Trung tan vỡ trong sự nuối tiếc của khán giả

Thứ 3, 10/03/2026 17:14
Cộng đồng LPL nói riêng và LMHT nói chung sửng sốt trước thông tin này.

Bỏ việc lương 50 triệu, nhận việc lương 36 triệu: Quyết định tưởng ngược đời mà xem ra rất hợp lý

Thứ 3, 10/03/2026 16:35
Đi làm để kiếm tiền nhưng lương cao đôi khi không giải quyết được hết mọi vấn đề.

Người duy nhất đánh bại được nhan sắc Phạm Băng Băng: Visual vang danh thiên hạ, càng ngắm càng say như điếu đổ

Thứ 3, 10/03/2026 16:33
Dù đã trải qua hơn 2 thập kỷ, mỹ nhân này vẫn là người duy nhất có thể áp đảo được Phạm Băng Băng.
     
Nổi bật trong ngày

Bắt giữ đối tượng Trần Thái Ngọc sinh năm 1992

Thứ 2, 09/03/2026 07:16
Trần Thái Ngọc là đối tượng bị truy nã về tội “Trộm cắp tài sản”.

Từng được kỳ vọng rất cao, bom tấn đình đám của năm 2026 bất ngờ mở cửa chơi miễn phí, game thủ chỉ còn 3 ngày để "tận hưởng"

Thứ 2, 09/03/2026 10:30
Game thủ sẽ chỉ còn được chơi tựa game này tới ngày 12/3, trước khi dự án chính thức đóng cửa.

Chấn động vụ con trai doanh nhân nổi tiếng Ukraine bị bắt cóc và sát hại dã man ở Bali

Thứ 2, 09/03/2026 11:25
Cảnh sát Indonesia xác nhận nạn nhân là công dân Ukraine Ihor Komarov, 28 tuổi, bị bắt cóc giữa tháng 2 trước khi được nhận dạng bằng giám định ADN từ các phần thi thể được tìm thấy tại đảo du lịch này. Ngay lập tức, sự việc đã gây ra chấn động trên toàn thế giới, đặc biệt dấy lên sự lo ngại của các du khách.

Hà Nội: Cô giáo mầm non viêm phổi do mắc thủy đậu, sai lầm vì "tôi nghĩ thủy đậu là bệnh của trẻ em"

Thứ 2, 09/03/2026 14:05
Chị Lê sốt cao kèm mụn nước, chụp cắt lớp vi tính lồng ngực có các vùng viêm kính mờ và ổ đông đặc rải rác hai bên phổi, chẩn đoán viêm phổi do thủy đậu.

9 điều dành riêng cho những ai muốn sống thọ, sống khỏe và hạnh phúc mỗi ngày

Thứ 2, 09/03/2026 20:00
Đây là bí quyết sống thọ, sống khỏe, sống hạnh phúc của một cụ bà 90 tuổi.
xe.nguoiduatin.vn