Lộ diện kĩ thuật bẻ khóa AI, bắt trí tuệ nhân tạo phải 'dạy' cách tạo bom xăng hay tiết lộ thông tin nguy hiểm

Thứ 2, 01/07/2024 12:29
Kỹ thuật "Skeleton Key" cho phép "vượt qua rào cản" an toàn của các mô hình ngôn ngữ lớn, khiến chúng có thể bị lợi dụng để tạo ra thông tin nguy hiểm. Từ công thức chế tạo bom xăng cho đến kiến thức về vũ khí sinh học, nguy cơ tiềm ẩn từ lỗ hổng này là vô cùng đáng lo ngại.

Các chuyên gia bảo mật tại Microsoft đã phát hiện ra một kỹ thuật "jailbreak" AI đáng lo ngại có tên gọi "Skeleton Key", cho phép người dùng khai thác lỗ hổng bảo mật để buộc các mô hình ngôn ngữ lớn tiết lộ thông tin nguy hiểm. Theo Mark Russinovich, giám đốc công nghệ của Microsoft Azure, kỹ thuật này có thể được sử dụng để buộc các mô hình AI như Llama3 của Meta, Gemini Pro của Google và GPT 3.5 của OpenAI cung cấp công thức chế tạo bom xăng và nhiều thông tin nguy hiểm khác.

Lộ diện kĩ thuật bẻ khóa AI, bắt trí tuệ nhân tạo phải 'dạy' cách tạo bom xăng hay tiết lộ thông tin nguy hiểm- Ảnh 1.

Điều đáng lo ngại hơn là "Skeleton Key" có khả năng vượt qua các "rào cản" bảo mật được thiết lập để ngăn chặn các yêu cầu độc hại. Russinovich cho biết: "Giống như tất cả các kỹ thuật vượt ngục khác, Skeleton Key hoạt động bằng cách thu hẹp khoảng cách giữa những gì mô hình có khả năng làm (dựa trên thông tin đăng nhập của người dùng, v.v.) và những gì nó sẵn sàng làm". Không giống như các kỹ thuật "vượt ngục" khác, "Skeleton Key" có thể buộc các mô hình AI tiết lộ thông tin một cách trực tiếp và đầy đủ, thay vì phải khai thác một cách gián tiếp.

Microsoft đã thử nghiệm "Skeleton Key" trên nhiều mô hình AI khác nhau và kết quả cho thấy kỹ thuật này hoạt động hiệu quả trên hầu hết các mô hình phổ biến hiện nay, bao gồm Meta Llama3, Google Gemini Pro, OpenAI GPT 3.5 Turbo, OpenAI GPT 4o, Mistral Large, Anthropic Claude 3 Opus, và Cohere Commander R Plus. Mô hình duy nhất cho thấy khả năng kháng cự nhất định là GPT-4 của OpenAI. Russinovich cho biết Microsoft đã phát hành một số bản cập nhật phần mềm để giảm thiểu tác động của "Skeleton Key" đối với các mô hình ngôn ngữ lớn của họ, bao gồm cả trợ lý AI Copilot.

Tuy nhiên, ông cũng khuyến cáo các công ty phát triển hệ thống AI nên thiết kế thêm các lớp bảo mật bổ sung, đồng thời giám sát chặt chẽ dữ liệu đầu vào và đầu ra của hệ thống để phát hiện kịp thời các nội dung độc hại. Từ đó, các biện pháp ngăn chặn và xử lý kịp thời sẽ giúp hạn chế rủi ro từ lỗ hổng "Skeleton Key" gây ra.

Ánh Viên

Cùng chuyên mục

Sân bay trên mặt nước đầu tiên của Việt Nam sẽ được xây dựng ở đâu?

Chủ nhật, 26/04/2026 00:00
Đây sẽ là sân bay đầu tiên tại Việt Nam xây dựng hoàn toàn trên mặt nước.

Faker có "thành tích" khó quên lần đầu tiên sau hơn 10 năm sự nghiệp

Thứ 7, 25/04/2026 22:33
Có lẽ chính Faker cũng không hiểu tại sao mình lại thi đấu như vậy.

Một vấn đề đau đầu giữa giáo viên và phụ huynh bỗng nhiên sáng tỏ sau khi xem... Tây du ký!

Thứ 7, 25/04/2026 22:28
Giáo dục, suy cho cùng, không phải là cuộc đấu trí giữa cha mẹ và thầy cô. Nó cần một sự phối hợp nhịp nhàng, trong đó mỗi bên hiểu rõ vai trò của mình.

Con gái lớp 6 bị nhóm bạn thân cô lập, nói xấu suốt 2 tháng trời, mẹ lo lắng phải lên mạng xin lời khuyên

Thứ 7, 25/04/2026 22:14
Ở độ tuổi trung học, chỉ cần một mâu thuẫn nhỏ, nếu không được định hướng kịp thời, rất dễ biến thành hành vi cô lập hoặc bắt nạt tinh thần kéo dài.

"Thà để mốc còn hơn cho nó ăn" - Chiếc bánh trứng tố cáo kiểu phụ huynh "đạo đức giả"

Thứ 7, 25/04/2026 22:13
Bản chất của giáo dục là sự dẫn dắt, không phải phớt lờ hay kìm nén.
     
Nổi bật trong ngày

Lan ý "rất thích" được tưới loại nước này: Chỉ 1 tháng 1 lần, cây ra hoa suốt năm

Thứ 7, 25/04/2026 08:00
Một nguyên liệu tưởng chừng bỏ đi trong bếp lại có thể giúp lan ý ra hoa liên tục, tiết kiệm chi phí và cực kỳ dễ áp dụng tại nhà.

Giải mã thế hệ HIFI: Lương cao, tiêu nhiều và bất an

Thứ 7, 25/04/2026 09:27
Một người có lương cao nhưng luôn lo cuối tháng thiếu tiền, lo mất việc sẽ không xoay xở được, lo không bao giờ mua nổi nhà… nhìn chung là thấy bất an tài chính.

Nissan Terrano đời mới ra mắt: Dáng SUV off-road hầm hố, máy hybrid cắm sạc hơn 400hp, sẽ bán ở ĐNÁ cạnh tranh Land Cruiser Prado

Thứ 7, 25/04/2026 09:00
Nissan hồi sinh huyền thoại Terrano dưới dạng SUV khung gầm rời sử dụng động cơ PHEV mạnh 402 mã lực. Mẫu xe này hứa hẹn sẽ tăng thêm sức nóng cho phân khúc địa hình tại thị trường ASEAN.

Sao phim Sex and City quyến rũ bậc nhất nhưng vẫn “cô đơn” ở tuổi 61: Lý do ít ai ngờ

Thứ 7, 25/04/2026 14:51
Sao phim Sex and the City Kristin Davis sống độc thân không phải vì “ế”, mà bởi lựa chọn rất rõ ràng về tình yêu, hôn nhân và cuộc sống.

1 ngày nghỉ lễ đi theo lịch trình “đậm chất Hà Nội” của Tổng thống Hàn Quốc Lee Jae Myung và phu nhân

Thứ 7, 25/04/2026 17:26
Một buổi tối dạo quanh Hồ Hoàn Kiếm, ăn một bát phở nóng hay cây kem bên hồ - hành trình rất “Hà Nội” của Tổng thống Hàn Quốc Lee Jae Myung và Phu nhân đang thu hút sự chú ý. Những trải nghiệm đời thường ấy cũng chính là gợi ý không thể bỏ qua cho du khách trong kỳ nghỉ lễ này.
xe.nguoiduatin.vn