Một công ty vừa dụ AI vào bẫy — để nó tự huấn luyện bằng 'rác' do chính nó tạo ra

Một công ty vừa dụ AI vào bẫy — để nó tự huấn luyện bằng 'rác' do chính nó tạo ra

Thứ 2, 24/03/2025 18:39
AI đang đánh cắp nội dung của bạn và các công ty AI đã xây dựng nên đế chế kinh doanh bằng cách thu thập dữ liệu web. Cloudflare, một dịch vụ mạng toàn cầu, đã nghĩ ra một kế hoạch mới để đối phó với vấn nạn này: "mê cung AI".

AI đang đánh cắp nội dung của bạn. Chúng ta đều biết các công ty AI đã xây dựng nên những doanh nghiệp trị giá hàng tỷ USD như thế nào – bằng cách cào dữ liệu web và sử dụng dữ liệu của bạn để huấn luyện chatbot. Việc cào dữ liệu web không phải là điều mới mẻ. Trước đây, các trang web có thể dựa vào các giao thức đơn giản như robots.txt để xác định những gì có thể và không thể được sử dụng bởi các trình thu thập thông tin web. Các hướng dẫn đó đã được các công ty thực hiện việc cào dữ liệu, chẳng hạn như xây dựng kết quả cho các công cụ tìm kiếm, tôn trọng. Tuy nhiên, các công ty AI lại không tuân thủ giao kèo xã hội này và phớt lờ các hướng dẫn đó.

one companys devious plan to sto
Chú thích ảnh

Cloudflare, một dịch vụ mạng toàn cầu giúp một số trang web lớn nhất thế giới phân phối nội dung đến người dùng, đã nghĩ ra một kế hoạch mới để đối phó với các trình cào dữ liệu web của các công ty AI. Ý tưởng này vừa xảo quyệt lại vừa khéo léo. Trong một bài đăng blog mới, Cloudflare đã chia sẻ cách họ đang "bẫy các bot cư xử sai trái trong một mê cung AI". Về cơ bản, các bot không tuân theo các quy tắc được đặt ra cho chúng thông qua các giao thức như robots.txt, một tệp văn bản đơn giản quy định những gì trình thu thập thông tin web được phép làm trên một trang web, sẽ bị can thiệp để làm lãng phí thời gian và tài nguyên của công ty phụ trách bot.

Cloudflare cho biết: "Nội dung do AI tạo ra đã bùng nổ… đồng thời, chúng tôi cũng chứng kiến ​​sự bùng nổ của các trình thu thập thông tin mới được các công ty AI sử dụng để cào dữ liệu cho việc huấn luyện mô hình. Các trình thu thập thông tin AI tạo ra hơn 50 tỷ yêu cầu đến mạng Cloudflare mỗi ngày, tương đương gần 1% tổng số yêu cầu web mà chúng tôi thấy." Cloudflare cho biết trước đây họ chỉ chặn các trình thu thập thông tin và cào dữ liệu web AI. Tuy nhiên, việc làm như vậy đã cảnh báo những người đứng sau các bot rằng quyền truy cập của họ đã bị từ chối, và kết quả là họ sẽ thay đổi chiến lược để tiếp tục các chiến dịch cào dữ liệu của mình.

Vì vậy, Cloudflare đã nảy ra ý tưởng xây dựng một "honeypot": một loạt các trang web giả được tạo bằng nội dung do AI tạo ra. Việc Cloudflare sử dụng nội dung do AI tạo ra để chống lại các trình cào dữ liệu web AI không chỉ đơn thuần là để hả hê. Khi AI huấn luyện trên nội dung do AI tạo ra, nó thực sự làm suy giảm chính mô hình AI. Ngành công nghiệp này thậm chí còn có một thuật ngữ cho nó: "model collapse" (sụp đổ mô hình). Cloudflare về cơ bản đang đảm bảo rằng các bot vi phạm quy tắc sẽ bị trừng phạt vì đã làm như vậy.

Bài đăng của Cloudflare đi sâu vào các chi tiết kỹ thuật của việc xây dựng mê cung AI. Nhưng, ý chính của nó là Cloudflare đã nghĩ ra mọi thứ theo cách mà khách truy cập là con người sẽ không bao giờ nhìn thấy các trang honeypot do AI tạo ra này. Ngoài ra, con người sẽ nhận thấy "những điều vô nghĩa do AI tạo ra" trên các trang này. Tuy nhiên, các bot sẽ rơi xuống hang thỏ, lãng phí tài nguyên tính toán khi chúng đi sâu hơn và sâu hơn qua nhiều trang nội dung do AI tạo ra. Khách hàng của Cloudflare có thể lựa chọn sử dụng mê cung AI ngay bây giờ để bảo vệ nội dung của họ khỏi các trình cào dữ liệu web.

Ánh Viên

Bình luận tiêu biểu (0)

Sắp xếp theo lượt thích | Sắp xếp theo ngày
Chưa có bình luận. Hãy là người đầu tiên bình luận bài viết này.
Cùng chuyên mục

Từ 01/7/2025, 12 trường hợp không được BHYT thanh toán chi phí khám chữa bệnh: Cập nhật ngay kẻo thiệt!

Thứ 5, 27/03/2025 08:51
Khi sử dụng thẻ BHYT hợp lệ, người bệnh được quỹ BHYT thanh toán hầu hết chi phí khám chữa bệnh. Tuy nhiên, từ 01/7/2025, vẫn có 12 trường hợp không được BHYT thanh toán chi phí khám chữa bệnh dù khám đúng tuyến.

Xử phạt tài xế xe cấp cứu hú còi chở dàn diễn viên đi ra mắt phim Âm Dương Lộ ở TP.HCM

Thứ 5, 27/03/2025 08:49
Nam tài xế chở dàn diễn viên, nghệ sĩ đến sự kiện ra mắt phim ở quận 3 vừa bị lực lượng chức năng lập biên bản xử phạt hành vi vi phạm hành chính.

Vụ xe cứu thương chở diễn viên đi họp báo phim Âm dương lộ: Ekip chính thức lên tiếng

Thứ 5, 27/03/2025 08:17
Ekip sản xuất phim "Âm dương lộ" vừa chính thức gửi lời ⁰xin lỗi sau vụ xe cứu thương đưa diễn viên đến dự họp báo. 

Hàng trăm người "xếp hàng" vào livestream đi tìm "kho báu" từ 1 cục đá: Tham thì... thâm!

Thứ 5, 27/03/2025 08:09
Cư dân mạng gọi “đổ thạch” là xé túi mù phiên bản đá quý.

Audi sắp có xe điện giá rẻ: Cùng phân khúc với A3, giá quy đổi dưới 830 triệu đồng, ra mắt năm sau

Thứ 5, 27/03/2025 08:02
Audi sắp ra mắt một mẫu ‘xe điện giá rẻ’ ngang hàng A3 độc lập với phần còn lại của đội hình.
    Xem thêm
Nổi bật trong ngày

'The Beast' có thế hệ mới: Nhìn rất Chevrolet song lại là Cadillac, tối tân hơn, chi phí sản xuất 1.000 tỷ đồng

Thứ 4, 26/03/2025 06:45
General Motors mới đây đã được Cơ quan Mật vụ Hoa Kỳ yêu cầu làm 'The Beast' mới với Cadillac Escalade có thể trở thành xe chuyên chở tổng thống đời mới nhất.

Bắt đối tượng trộm tài sản của họ hàng đem đi bán

Thứ 4, 26/03/2025 08:18
Sau khi bị khởi tố về tội "Trộm cắp tài sản" vào tháng 8 năm ngoái, Như lợi dụng việc được tại ngoại do nuôi con nhỏ để bỏ trốn.

Thêm một game Final Fantasy… “bay màu”, kịch bản giống hệt những gì Square Enix đã từng làm trong quá khứ

Thứ 4, 26/03/2025 10:40
IP Final Fantasy tiếp tục mang tới tin buồn cho cộng đồng game thủ.

BMW 3-Series 2027 được bắt gặp chạy thử: Là bản hybrid nhẹ, có cả hybrid sạc điện, thiết kế mới, màn HUD trải dài kính lái

Thứ 4, 26/03/2025 12:00
BMW 3-Series sẽ kỷ niệm sinh nhật lần thứ 50 bằng màn "lột xác" toàn diện vào năm 2027. Mẫu xe hứa hẹn trẻ trung và mạnh mẽ hơn với thiết kế mới cùng tùy chọn động cơ điện và động cơ đốt trong.

CSGT giằng co với người đàn ông giữa phố: Đoạn clip đã bị cắt ghép, không phản ánh đúng

Thứ 4, 26/03/2025 14:09
Rất nhiều người dân đã tụ tập xung quanh để quay clip và theo dõi vụ việc xảy ra.
xe.nguoiduatin.vn