Lời đe dọa của Musk được đưa ra trên một bài viết Twitter, sau khi Mashable và các ấn phẩm khác báo cáo rằng Microsoft sẽ loại bỏ Twitter khỏi nền tảng quảng cáo của mình, cho phép người mua quảng cáo quản lý tất cả các tài khoản mạng xã hội của họ ở một nơi.
“Họ đã đào tạo trái phép bằng cách sử dụng dữ liệu Twitter,” Musk viết trên Twitter.
Điều khá thú vị là Elon Musk, đồng thời là CEO của Tesla và SpaceX, thường chia sẻ trạng thái Twitter về những kế hoạch không bao giờ thành hiện thực và dường như không có vụ kiện nào được đệ trình. Được biết, đại diện của Microsoft đã từ chối bình luận về điều này.
Lời đe dọa của Musk là dấu hiệu mới nhất cho thấy quyền sở hữu dữ liệu đang nhanh chóng trở thành một chiến trường khốc liệt trong cơn sốt AI. Các công ty Công nghệ lớn đang làm việc để phát triển các mô hình AI tiên tiến như GPT của OpenAI và chủ sở hữu dữ liệu đang tìm cách ngăn chặn chúng hoặc tính phí sử dụng nội dung của chúng.
Microsoft phát triển cái gọi là mô hình ngôn ngữ lớn (LLM) của riêng mình và bán quyền truy cập vào các mô hình của OpenAI. Microsoft đã đầu tư 10 tỷ USD vào OpenAI vào năm ngoái trong một thỏa thuận có cấu trúc khác thường. Musk là người đồng sáng lập OpenAI trước khi rời hội đồng quản trị vào năm 2018 và gần đây đã phàn nàn về việc công ty chuyển từ mô hình phi lợi nhuận sang một doanh nghiệp có giá trị cao chịu ảnh hưởng của Microsoft.
Các LLM như GPT yêu cầu hàng terabyte dữ liệu để đào tạo, phần lớn trong số đó được lấy từ các trang web như Reddit, StackOverflow và Twitter. Dữ liệu đào tạo từ các mạng xã hội rất có giá trị vì nó ghi lại các cuộc trò chuyện qua lại thân mật.
Khi các mô hình AI mới này chuyển từ phòng thí nghiệm nghiên cứu và trường đại học sang thế giới doanh nghiệp, chủ sở hữu dữ liệu bắt đầu đưa ra yêu cầu.
Ví dụ: Reddit cho biết vào đầu tuần này rằng họ sẽ tính phí các công ty truy cập vào giao diện lập trình được sử dụng để đưa các cuộc hội thoại giữa các Redditor vào phần mềm đào tạo AI. Universal Music Group cũng cho biết trong tuần này rằng việc đào tạo âm nhạc cho các nghệ sĩ như vậy sẽ thể hiện “vừa vi phạm các thỏa thuận của chúng tôi vừa vi phạm luật bản quyền” để đáp lại một video lan truyền về một bài hát tuyên bố sử dụng AI để bắt chước rapper Drake.
Và cơ sở dữ liệu ảnh stock Getty Images đang kiện Stable Diffusion, cáo buộc rằng công ty đã sao chép nội dung của nó để đào tạo trình tạo hình ảnh AI của mình.
Musk cho biết vào tháng 12 rằng Twitter sẽ “tạm dừng” quyền truy cập của OpenAI vào cơ sở dữ liệu của mình. Anh ấy cũng đã công bố kế hoạch xây dựng mô hình ngôn ngữ lớn của riêng mình tại một trong những công ty của anh ấy có tên là TruthGPT.
Anh Nguyễn