Lộ diện kĩ thuật bẻ khóa AI, bắt trí tuệ nhân tạo phải 'dạy' cách tạo bom xăng hay tiết lộ thông tin nguy hiểm

Thứ 2, 01/07/2024 12:29
Kỹ thuật "Skeleton Key" cho phép "vượt qua rào cản" an toàn của các mô hình ngôn ngữ lớn, khiến chúng có thể bị lợi dụng để tạo ra thông tin nguy hiểm. Từ công thức chế tạo bom xăng cho đến kiến thức về vũ khí sinh học, nguy cơ tiềm ẩn từ lỗ hổng này là vô cùng đáng lo ngại.

Các chuyên gia bảo mật tại Microsoft đã phát hiện ra một kỹ thuật "jailbreak" AI đáng lo ngại có tên gọi "Skeleton Key", cho phép người dùng khai thác lỗ hổng bảo mật để buộc các mô hình ngôn ngữ lớn tiết lộ thông tin nguy hiểm. Theo Mark Russinovich, giám đốc công nghệ của Microsoft Azure, kỹ thuật này có thể được sử dụng để buộc các mô hình AI như Llama3 của Meta, Gemini Pro của Google và GPT 3.5 của OpenAI cung cấp công thức chế tạo bom xăng và nhiều thông tin nguy hiểm khác.

Lộ diện kĩ thuật bẻ khóa AI, bắt trí tuệ nhân tạo phải 'dạy' cách tạo bom xăng hay tiết lộ thông tin nguy hiểm- Ảnh 1.

Điều đáng lo ngại hơn là "Skeleton Key" có khả năng vượt qua các "rào cản" bảo mật được thiết lập để ngăn chặn các yêu cầu độc hại. Russinovich cho biết: "Giống như tất cả các kỹ thuật vượt ngục khác, Skeleton Key hoạt động bằng cách thu hẹp khoảng cách giữa những gì mô hình có khả năng làm (dựa trên thông tin đăng nhập của người dùng, v.v.) và những gì nó sẵn sàng làm". Không giống như các kỹ thuật "vượt ngục" khác, "Skeleton Key" có thể buộc các mô hình AI tiết lộ thông tin một cách trực tiếp và đầy đủ, thay vì phải khai thác một cách gián tiếp.

Microsoft đã thử nghiệm "Skeleton Key" trên nhiều mô hình AI khác nhau và kết quả cho thấy kỹ thuật này hoạt động hiệu quả trên hầu hết các mô hình phổ biến hiện nay, bao gồm Meta Llama3, Google Gemini Pro, OpenAI GPT 3.5 Turbo, OpenAI GPT 4o, Mistral Large, Anthropic Claude 3 Opus, và Cohere Commander R Plus. Mô hình duy nhất cho thấy khả năng kháng cự nhất định là GPT-4 của OpenAI. Russinovich cho biết Microsoft đã phát hành một số bản cập nhật phần mềm để giảm thiểu tác động của "Skeleton Key" đối với các mô hình ngôn ngữ lớn của họ, bao gồm cả trợ lý AI Copilot.

Tuy nhiên, ông cũng khuyến cáo các công ty phát triển hệ thống AI nên thiết kế thêm các lớp bảo mật bổ sung, đồng thời giám sát chặt chẽ dữ liệu đầu vào và đầu ra của hệ thống để phát hiện kịp thời các nội dung độc hại. Từ đó, các biện pháp ngăn chặn và xử lý kịp thời sẽ giúp hạn chế rủi ro từ lỗ hổng "Skeleton Key" gây ra.

Ánh Viên

Cùng chuyên mục

Sẽ thế nào nếu các đặc vụ VALORANT xuất thân từ vũ trụ “Nhện nhọ”?

Thứ 4, 03/07/2024 12:05
Sự kết hợp độc đáo đã mang đến một diện mạo rất mới cho các đặc vụ VALORANT.

Bloomberg: Với xe điện Trung Quốc, tiền không là tất cả!

Thứ 4, 03/07/2024 11:55
Nếu chỉ cần đầu tư thật nhiều tiền để thành công, Trung Quốc đã có thể thống trị mọi ngành công nghiệp, từ sản xuất máy bay đến sản xuất chất bán dẫn.

Ford Ranger sắp thêm bản mới: Rẻ hơn hẳn Raptor nhưng offroad không kém, như bản Sport nhiều đồ xịn

Thứ 4, 03/07/2024 11:53
Ford Ranger sắp có phiên bản off-road mới với tên gọi Tremor, được phát triển dựa trên biến thể Sport tầm trung, hứa hẹn mang đến khả năng vận hành mạnh mẽ với động cơ diesel tăng áp kép.

Gọi xe ôm thấy tài xế có mùi lạ nhưng vẫn đi, ngồi lên xe chưa được 1 phút người đàn ông đã phải trả giá

Thứ 4, 03/07/2024 11:51
Người đàn ông đã dùng điện thoại ghi lại toàn bộ hành trình của mình và khiến người xem không khỏi thót tim.

Ngôi nhà cháy tại Hà Nội sáng nay nằm trong tổ liên gia an toàn PCCC, đã mở lối thoát thứ 2

Thứ 4, 03/07/2024 11:48
Theo thông tin từ công an, ngôi nhà được trang bị bình chữa cháy xách tay, mở lối thoát nạn thứ 2, rất may vụ việc không gây thiệt hại về người.
     
Nổi bật trong ngày

"Chết đi sống lại" trên chấm 11m, Ronaldo chính thức đưa ra tuyên bố đầy khó khăn về Euro

Thứ 3, 02/07/2024 06:46
Ronaldo đã đá hỏng 1 quả penalty trong trận đấu giữa Bồ Đào Nha và Slovakia ở vòng 1/8 Euro 2024.

Chấm điểm Bồ Đào Nha vs Slovenia: Một ngôi sao còn sáng hơn Diogo Costa, Ronaldo gây thất vọng

Thứ 3, 02/07/2024 08:11
Theo chấm điểm từ WhoScored thì thủ môn Diogo Costa vẫn chưa phải là cầu thủ xuất sắc nhất dù cản phá 3 quả luân lưu giúp Bồ Đào Nha vào tứ kết Euro 2024.

Thành Cát Tư Hãn và 'sở thích đặc biệt' gây ám ảnh cho phụ nữ thời xưa: Hé lộ góc khuất trong cuộc đời vị Đại Hãn

Thứ 3, 02/07/2024 10:24
Ẩn sau hình ảnh người anh hùng oai hùng là một khía cạnh khác trong đời tư của ông, nơi "sở thích đặc biệt" này trở thành chủ đề bàn tán và ám ảnh cho biết bao phụ nữ thời cổ đại.

Mỹ nhân màn ảnh Việt thập niên 90, bạn diễn cùng Thương Tín trong 'Tình khúc 68” sống ra sao sau nhiều năm vắng bóng: Tuổi 60 xinh đẹp, đài các, làm mẹ đơn thân của 3 con

Thứ 3, 02/07/2024 11:15
Sau nhiều năm vắng bóng trong giới giải trí, hiện mỹ nhân này có cuộc sống bình dị bên các con thân yêu.

Một ngành lần đầu tiên được tuyển sinh tại Đại học Y Hà Nội, chỉ duy nhất 60 suất: Học phí cực kỳ có lợi, cơ hội việc làm lương cao thì không thiếu

Thứ 3, 02/07/2024 11:59
Trước xu hướng hiện nay, trường Đại học Y Hà Nội cũng đã bắt đầu tuyển sinh ngành này từ năm 2024.
xe.nguoiduatin.vn