Lộ diện kĩ thuật bẻ khóa AI, bắt trí tuệ nhân tạo phải 'dạy' cách tạo bom xăng hay tiết lộ thông tin nguy hiểm

Các chuyên gia bảo mật tại Microsoft đã phát hiện ra một kỹ thuật "jailbreak" AI đáng lo ngại có tên gọi "Skeleton Key", cho phép người dùng khai thác lỗ hổng bảo mật để buộc các mô hình ngôn ngữ lớn tiết lộ thông tin nguy hiểm. Theo Mark Russinovich, giám đốc công nghệ của Microsoft Azure, kỹ thuật này có thể được sử dụng để buộc các mô hình AI như Llama3 của Meta, Gemini Pro của Google và GPT 3.5 của OpenAI cung cấp công thức chế tạo bom xăng và nhiều thông tin nguy hiểm khác.

Điều đáng lo ngại hơn là "Skeleton Key" có khả năng vượt qua các "rào cản" bảo mật được thiết lập để ngăn chặn các yêu cầu độc hại. Russinovich cho biết: "Giống như tất cả các kỹ thuật vượt ngục khác, Skeleton Key hoạt động bằng cách thu hẹp khoảng cách giữa những gì mô hình có khả năng làm (dựa trên thông tin đăng nhập của người dùng, v.v.) và những gì nó sẵn sàng làm". Không giống như các kỹ thuật "vượt ngục" khác, "Skeleton Key" có thể buộc các mô hình AI tiết lộ thông tin một cách trực tiếp và đầy đủ, thay vì phải khai thác một cách gián tiếp.

Microsoft đã thử nghiệm "Skeleton Key" trên nhiều mô hình AI khác nhau và kết quả cho thấy kỹ thuật này hoạt động hiệu quả trên hầu hết các mô hình phổ biến hiện nay, bao gồm Meta Llama3, Google Gemini Pro, OpenAI GPT 3.5 Turbo, OpenAI GPT 4o, Mistral Large, Anthropic Claude 3 Opus, và Cohere Commander R Plus. Mô hình duy nhất cho thấy khả năng kháng cự nhất định là GPT-4 của OpenAI. Russinovich cho biết Microsoft đã phát hành một số bản cập nhật phần mềm để giảm thiểu tác động của "Skeleton Key" đối với các mô hình ngôn ngữ lớn của họ, bao gồm cả trợ lý AI Copilot.

Tuy nhiên, ông cũng khuyến cáo các công ty phát triển hệ thống AI nên thiết kế thêm các lớp bảo mật bổ sung, đồng thời giám sát chặt chẽ dữ liệu đầu vào và đầu ra của hệ thống để phát hiện kịp thời các nội dung độc hại. Từ đó, các biện pháp ngăn chặn và xử lý kịp thời sẽ giúp hạn chế rủi ro từ lỗ hổng "Skeleton Key" gây ra.

Ánh Viên

Lộ diện kĩ thuật bẻ khóa AI, bắt trí tuệ nhân tạo phải 'dạy' cách tạo bom xăng hay tiết lộ thông tin nguy hiểm

Microsoft phải ra tay sau động thái gây tranh cãi của LG với người dùng Windows 11

Tia hy vọng chấm dứt cuộc xung đột dài hơn nửa thế kỷ sau cuộc gặp lịch sử ở Nhà Trắng

Bác sĩ cảnh báo cơn sốt uống magie trên mạng xã hội: Người người nhà nhà đang mua bổ sung nhưng "không phải cứ mất ngủ, stress là nên uống"

Quốc gia nhiều người Việt yêu thích áp dụng quy định mới về kiểm tra hành lý, ai chuẩn bị đi cần lưu ý gấp

Tất cả chủ xe máy, ô tô vi phạm giao thông có biển số sau nhanh chóng nộp phạt nguội theo Nghị định 168

4 loại thịt chứa nhiều cholesterol nhất

Mỹ bỗng dưng săn lùng thứ mà chẳng ai muốn cất trong nhà mình: Họ không làm cho vui, tất cả đều có lý do

Toyota Crown 2027 ra mắt: Máy hybrid mới, tăng giá mạnh vì thêm loạt công nghệ

Mazda3, CX-30 thêm tính năng an toàn cùng động cơ 2.5L hybrid mới giống CX-5

Ford Transit City - Phiên bản tối ưu chở hàng nhưng có hẳn màn hình lớn, ADAS, động cơ điện chạy hơn 380km/sạc

Tin đọc nhiều

4 loại thịt chứa nhiều cholesterol nhất

Mỹ bỗng dưng săn lùng thứ mà chẳng ai muốn cất trong nhà mình: Họ không làm cho vui, tất cả đều có lý do

Toyota Crown 2027 ra mắt: Máy hybrid mới, tăng giá mạnh vì thêm loạt công nghệ

Mazda3, CX-30 thêm tính năng an toàn cùng động cơ 2.5L hybrid mới giống CX-5

Ford Transit City - Phiên bản tối ưu chở hàng nhưng có hẳn màn hình lớn, ADAS, động cơ điện chạy hơn 380km/sạc

Báo giá quảng cáo