Kỳ lạ mô hình AI mới của Trung Quốc, được ca ngợi là siêu thông minh nhưng liên tục khẳng định mình là ChatGPT

Kỳ lạ mô hình AI mới của Trung Quốc, được ca ngợi là siêu thông minh nhưng liên tục khẳng định mình là ChatGPT

Thứ 3, 31/12/2024 11:34
Dù được ca ngợi là có khả năng xử lý văn bản cũng như thực hiện nhiều tác vụ ngang hàng với các mô hình AI hàng đầu thế giới, mô hình AI mới của Trung Quốc liên tục tự nhận mình là ChatGPT.

Đầu tuần vừa qua, DeepSeek, một startup AI mới nổi ở Trung Quốc, mới đây đã công bố mô hình AI "mở" mang tên DeepSeek V3. Được xây dựng trên một tập dữ liệu khổng lồ với hơn 600 tỷ tham số, nhưng mô hình này nổi bật vì sử dụng hiệu quả phần cứng, đồng thời vẫn thể hiện khả năng xử lý các tác vụ dựa trên văn bản như lập trình và viết luận văn một cách dễ dàng. Tuy nhiên, điều đáng ngạc nhiên là DeepSeek V3 dường như tin rằng mình chính là ChatGPT, nền tảng chatbot được cung cấp bởi OpenAI.

Hàng loạt bài đăng trên mạng xã hội X và kết quả thử nghiệm của TechCrunch đã cho thấy DeepSeek V3 tự xưng mình là ChatGPT. Khi được yêu cầu giải thích, mô hình này khẳng định đây là một phiên bản của GPT-4, mô hình do OpenAI phát hành vào năm 2023. Sự nhầm lẫn này còn đi xa hơn khi DeepSeek V3 đưa ra hướng dẫn sử dụng API của OpenAI khi được hỏi về API của chính DeepSeek. Thậm chí, mô hình này còn kể một số câu chuyện cười giống hệt GPT-4, từ nội dung cho đến cả câu chốt hài.

gf46kyfawaqk9f
5 trong số 8 lần tạo ra câu trả lời, DeepSeek V3 đều nhận mình là ChatGPT, chỉ có 3 lần mô hình này nhận mình là DeepSeek V3.

Vậy điều gì đang xảy ra ở đây?

Về cơ bản, các mô hình như ChatGPT và DeepSeek V3 là những hệ thống thống kê, được huấn luyện trên hàng tỷ ví dụ để học các mẫu và đưa ra dự đoán. DeepSeek chưa tiết lộ nhiều về nguồn dữ liệu huấn luyện của DeepSeek V3, nhưng có rất nhiều bộ dữ liệu công khai chứa văn bản được tạo ra bởi GPT-4 thông qua ChatGPT. Nếu DeepSeek V3 được huấn luyện trên những dữ liệu này, mô hình có thể đã ghi nhớ một số kết quả của GPT-4 và đang nhắc lại chúng một cách nguyên văn.

Mike Cook, nghiên cứu viên tại Đại học King's College London, chuyên về AI, cho biết: "Rõ ràng là mô hình này đang thấy các phản hồi thô từ ChatGPT tại một thời điểm nào đó, nhưng không rõ điều đó xảy ra ở đâu. Nó có thể là 'vô tình', nhưng đáng tiếc là chúng ta đã chứng kiến các trường hợp mọi người trực tiếp huấn luyện mô hình của họ trên kết quả của các mô hình khác để cố gắng ăn theo kiến thức của họ."

Ông Cook cũng lưu ý rằng việc huấn luyện mô hình bằng kết quả từ các hệ thống AI đối thủ có thể "rất tệ" cho chất lượng mô hình, vì nó có thể dẫn đến các ảo giác và câu trả lời sai lệch. "Giống như chụp bản sao của một bản sao, chúng ta sẽ mất đi ngày càng nhiều thông tin và kết nối với thực tế," ông nói. Nói cách khác nó chính là ví dụ điển hình của câu "Tam sao thất bản".

1735313362778 471592

CEO OpenAI, ông Sam Altman đã ngụ ý nói về điều này trong dòng tweet của mình không lâu sau khi DeepSeek V3 được công bố vào ngày 26-12 vừa qua. Điều này cũng có thể vi phạm điều khoản dịch vụ của hệ thống OpenAI. Các điều khoản của OpenAI cấm người dùng sản phẩm của họ, bao gồm cả khách hàng ChatGPT, sử dụng kết quả để phát triển các mô hình cạnh tranh với chính OpenAI.

Tuy nhiên, DeepSeek V3 không phải là mô hình đầu tiên xác định sai danh tính của mình. Gemini của Google và các mô hình khác đôi khi cũng tự nhận mình là các mô hình cạnh tranh. Điều này một phần là do web, nơi các công ty AI lấy phần lớn dữ liệu huấn luyện, đang trở nên tràn ngập nội dung do AI tạo ra. Các trang trại nội dung đang sử dụng AI để tạo ra tin tức giật gân. Các bot đang tràn ngập Reddit và X. Theo một ước tính, 90% web có thể được tạo ra bởi AI vào năm 2026.

Sự "ô nhiễm" này đã khiến việc lọc triệt để các kết quả của AI khỏi tập dữ liệu huấn luyện trở nên khó khăn. Heidy Khlaaf, trưởng khoa học gia AI tại viện phi lợi nhuận AI Now Institute, cho rằng việc tiết kiệm chi phí từ việc "chưng cất" kiến thức của một mô hình hiện có có thể hấp dẫn các nhà phát triển, bất kể rủi ro.

deepseek ai model says it is chatgpt

Tuy nhiên, điều đáng lo ngại hơn là khả năng DeepSeek V3, bằng cách hấp thụ và lặp lại một cách không phê phán các kết quả của GPT-4, có thể làm trầm trọng thêm một số thành kiến và khuyết điểm của mô hình này. Nếu DeepSeek V3 không thể tự xác định chính xác bản thân mình, thì làm sao người dùng có thể tin tưởng vào các câu trả lời khác của nó?

Sự xuất hiện của DeepSeek V3 đã đặt ra nhiều câu hỏi về đạo đức và trách nhiệm trong việc phát triển AI. Liệu việc sử dụng dữ liệu từ các mô hình đối thủ có phải là một chiêu trò đạo văn tinh vi, hay chỉ đơn giản là sự vô tình trong một thế giới web ngày càng bị chi phối bởi nội dung do AI tạo ra? Dù động cơ là gì, rõ ràng chúng ta cần phải cảnh giác hơn trong việc đánh giá và sử dụng các hệ thống AI, đặc biệt là khi ranh giới giữa thực và ảo ngày càng trở nên mờ nhạt.

Nguyễn Hải

 
Cùng chuyên mục

Chấn động lịch sử túc cầu: Cristiano Ronaldo, Lionel Messi, Kylian Mbappe và Vinicius Junior cùng chung 1 khung hình - CHUYỆN GÌ ĐÂY?

Thứ 5, 09/04/2026 07:52
"Mọi người đều muốn một mảnh ghép", kèm hashtag #HonestlyItsNotAI (Đây Thực Sự Không Phải AI), Messi viết trên trang Instagram kèm video quảng cáo từ LEGO.

Tuyển Việt Nam thắng 3-0 trước khi đấu Hàn Quốc để tranh vé World Cup

Thứ 5, 09/04/2026 07:16
Đội tuyển trẻ U17 Việt Nam có chiến thắng thuyết phục trước khi dự giải U17 châu Á 2026.

Đại lý báo Lynk & Co 03 có 2 bản tại Việt Nam: Giá dự kiến từ 800 triệu đồng, mạnh ngang Civic, ADAS từ bản rẻ nhất, dễ ra mắt tháng 6

Thứ 5, 09/04/2026 06:44
Phiên bản thông thường của Lynk & Co 03 có thể sắp bán tại Việt Nam với diện mạo hầm hố và nhiều trang bị hiện đại ngay từ bản tiêu chuẩn.

Mũi Né vào Top 10 điểm đến xu hướng toàn cầu 2026: Tăng trưởng 20%, hút mạnh khách quốc tế

Thứ 5, 09/04/2026 06:14
Không còn là lựa chọn “đi cho biết”, một điểm đến quen thuộc của Việt Nam đang được gọi tên trong Top xu hướng du lịch toàn cầu 2026 khi hội tụ đủ trải nghiệm.

Cô giáo từng “bỏ việc đi khắp thế giới” sau 11 năm nay trở về quê: Cuộc sống giờ khác xa tưởng tượng

Thứ 5, 09/04/2026 06:07
Từng gây sốt với quyết định bỏ việc để “đi khắp thế giới”, cuộc sống của cô gái này sau hơn chục năm khiến mọi người bất ngờ.
     
Nổi bật trong ngày

Xiaomi ra mắt máy pha cà phê viên nén Mijia nhỏ gọn, bản cũ ở Việt Nam giá chưa đến 3 triệu

Thứ 4, 08/04/2026 01:26
Xiaomi Mijia Capsule Coffee Machine sở hữu bơm ULKA 19 Bar, hai mức dung tích cốc, khởi động trong 25 giây và vận hành ở mức ồn khoảng 55 dB(A).

Thua đau trước Thái Lan, tuyển Việt Nam đại chiến Indonesia ở bán kết AFF Cup

Thứ 4, 08/04/2026 19:38
Thi đấu đầy quả cảm song tuyển futsal Việt Nam vẫn không thể tránh được thất bại khi chạm trán chủ nhà Thái Lan.

Blind test camera Galaxy S26 Ultra và Leica Leitzphone by Xiaomi: Bài thử dễ phân biệt nhất?

Thứ 4, 08/04/2026 02:01
Dù đã dấu tên, dám chắc rằng đến 99% người xem những ảnh này đều nhận ra ngay đâu là Galaxy S26 Ultra chụp, và đâu là Leica Leitzphone by Xiaomi chụp.

Muốn nghe nhạc khi ngủ mà đeo tai nghe quá phiền? Hãy thử dùng loa ngủ đặt dưới gối này

Thứ 5, 09/04/2026 01:31
Không gây đau tai khi nằm nghiêng, không làm phiền người nằm cạnh, có thể phát podcast, nhạc thư giãn hoặc tiếng ồn trắng suốt đêm, loa đặt dưới gối đang trở thành giải pháp được nhiều người khó ngủ tìm đến thay cho tai nghe in-ear truyền thống.

Nhóm người Việt làm bodykit cho VinFast Limo Green được hãng chia sẻ lại: 'Tốn hàng trăm triệu đồng, mất gần nửa năm, phải đập đi xây lại nhiều lần'

Thứ 4, 08/04/2026 07:22
Dự án bodykit dành cho VinFast Limo Green của nhóm 9X tại TP.HCM vừa hoàn thiện sau 5 tháng thực nghiệm. Với chi phí nghiên cứu lên tới hàng trăm triệu đồng, nhóm đang cố gắng tạo ra sản phẩm có độ hoàn thiện không kém hãng nước ngoài.
xe.nguoiduatin.vn