Google cho biết chatbot trí tuệ nhân tạo chủ lực của hãng, Gemini, đã trở thành mục tiêu của một chiến dịch quy mô lớn nhằm sao chép công nghệ. Theo báo cáo công bố hôm thứ Năm, một nhóm kẻ tấn công đã gửi hơn 100.000 prompt đến hệ thống trong nỗ lực khai thác cách mô hình vận hành.
Google mô tả đây là các “distillation attacks”, hay còn gọi là hình thức tấn công chiết xuất. Thay vì tấn công hạ tầng kỹ thuật, các bên này liên tục đặt câu hỏi với số lượng lớn, được thiết kế có chủ đích để buộc chatbot tiết lộ các mẫu logic và cơ chế suy luận bên trong. Một số truy vấn tập trung vào việc làm rõ cách Gemini “lý luận” và xử lý thông tin.
Theo công ty, các tác nhân đứng sau phần lớn là doanh nghiệp tư nhân hoặc nhà nghiên cứu có động cơ thương mại, tìm cách xây dựng hoặc cải thiện mô hình AI của riêng mình để giành lợi thế cạnh tranh. Google cho biết các hoạt động này đến từ nhiều khu vực trên thế giới, nhưng không tiết lộ danh tính cụ thể.
Google xem hành vi “chưng cất” mô hình là một dạng đánh cắp tài sản trí tuệ. Các tập đoàn công nghệ đã chi hàng tỷ USD để phát triển mô hình ngôn ngữ lớn, và cấu trúc nội tại của những hệ thống này được coi là tài sản độc quyền có giá trị cao.Dù đã triển khai cơ chế phát hiện và chặn các hoạt động bất thường, công ty thừa nhận các LLM vốn mở cho người dùng internet nên luôn tồn tại nguy cơ bị khai thác.
Ông John Hultquist, trưởng nhóm phân tích của bộ phận tình báo mối đe dọa tại Google, nhận định quy mô tấn công nhắm vào Gemini cho thấy kiểu hành vi này có thể sớm trở nên phổ biến, đặc biệt khi ngày càng nhiều doanh nghiệp phát triển các mô hình AI tùy chỉnh dựa trên dữ liệu nhạy cảm.
Vào năm ngoái, OpenAI cũng từng tố cáo đích danh đối thủ DeepSeek vì sử dụng cách thức tấn công chiết xuất đối với ChatGPT để cải thiện năng lực xử lý cho mô hình AI của họ.
Trong bối cảnh cạnh tranh AI toàn cầu ngày càng gay gắt, vụ việc một lần nữa cho thấy thách thức lớn đối với các công ty công nghệ: bảo vệ bí quyết cốt lõi của mô hình trong khi vẫn phải cung cấp dịch vụ rộng rãi cho người dùng trên internet.
Nguyễn Hải
