Kỳ lạ mô hình AI mới của Trung Quốc, được ca ngợi là siêu thông minh nhưng liên tục khẳng định mình là ChatGPT

Kỳ lạ mô hình AI mới của Trung Quốc, được ca ngợi là siêu thông minh nhưng liên tục khẳng định mình là ChatGPT

Thứ 3, 31/12/2024 11:34
Dù được ca ngợi là có khả năng xử lý văn bản cũng như thực hiện nhiều tác vụ ngang hàng với các mô hình AI hàng đầu thế giới, mô hình AI mới của Trung Quốc liên tục tự nhận mình là ChatGPT.

Đầu tuần vừa qua, DeepSeek, một startup AI mới nổi ở Trung Quốc, mới đây đã công bố mô hình AI "mở" mang tên DeepSeek V3. Được xây dựng trên một tập dữ liệu khổng lồ với hơn 600 tỷ tham số, nhưng mô hình này nổi bật vì sử dụng hiệu quả phần cứng, đồng thời vẫn thể hiện khả năng xử lý các tác vụ dựa trên văn bản như lập trình và viết luận văn một cách dễ dàng. Tuy nhiên, điều đáng ngạc nhiên là DeepSeek V3 dường như tin rằng mình chính là ChatGPT, nền tảng chatbot được cung cấp bởi OpenAI.

Hàng loạt bài đăng trên mạng xã hội X và kết quả thử nghiệm của TechCrunch đã cho thấy DeepSeek V3 tự xưng mình là ChatGPT. Khi được yêu cầu giải thích, mô hình này khẳng định đây là một phiên bản của GPT-4, mô hình do OpenAI phát hành vào năm 2023. Sự nhầm lẫn này còn đi xa hơn khi DeepSeek V3 đưa ra hướng dẫn sử dụng API của OpenAI khi được hỏi về API của chính DeepSeek. Thậm chí, mô hình này còn kể một số câu chuyện cười giống hệt GPT-4, từ nội dung cho đến cả câu chốt hài.

gf46kyfawaqk9f
5 trong số 8 lần tạo ra câu trả lời, DeepSeek V3 đều nhận mình là ChatGPT, chỉ có 3 lần mô hình này nhận mình là DeepSeek V3.

Vậy điều gì đang xảy ra ở đây?

Về cơ bản, các mô hình như ChatGPT và DeepSeek V3 là những hệ thống thống kê, được huấn luyện trên hàng tỷ ví dụ để học các mẫu và đưa ra dự đoán. DeepSeek chưa tiết lộ nhiều về nguồn dữ liệu huấn luyện của DeepSeek V3, nhưng có rất nhiều bộ dữ liệu công khai chứa văn bản được tạo ra bởi GPT-4 thông qua ChatGPT. Nếu DeepSeek V3 được huấn luyện trên những dữ liệu này, mô hình có thể đã ghi nhớ một số kết quả của GPT-4 và đang nhắc lại chúng một cách nguyên văn.

Mike Cook, nghiên cứu viên tại Đại học King's College London, chuyên về AI, cho biết: "Rõ ràng là mô hình này đang thấy các phản hồi thô từ ChatGPT tại một thời điểm nào đó, nhưng không rõ điều đó xảy ra ở đâu. Nó có thể là 'vô tình', nhưng đáng tiếc là chúng ta đã chứng kiến các trường hợp mọi người trực tiếp huấn luyện mô hình của họ trên kết quả của các mô hình khác để cố gắng ăn theo kiến thức của họ."

Ông Cook cũng lưu ý rằng việc huấn luyện mô hình bằng kết quả từ các hệ thống AI đối thủ có thể "rất tệ" cho chất lượng mô hình, vì nó có thể dẫn đến các ảo giác và câu trả lời sai lệch. "Giống như chụp bản sao của một bản sao, chúng ta sẽ mất đi ngày càng nhiều thông tin và kết nối với thực tế," ông nói. Nói cách khác nó chính là ví dụ điển hình của câu "Tam sao thất bản".

1735313362778 471592

CEO OpenAI, ông Sam Altman đã ngụ ý nói về điều này trong dòng tweet của mình không lâu sau khi DeepSeek V3 được công bố vào ngày 26-12 vừa qua. Điều này cũng có thể vi phạm điều khoản dịch vụ của hệ thống OpenAI. Các điều khoản của OpenAI cấm người dùng sản phẩm của họ, bao gồm cả khách hàng ChatGPT, sử dụng kết quả để phát triển các mô hình cạnh tranh với chính OpenAI.

Tuy nhiên, DeepSeek V3 không phải là mô hình đầu tiên xác định sai danh tính của mình. Gemini của Google và các mô hình khác đôi khi cũng tự nhận mình là các mô hình cạnh tranh. Điều này một phần là do web, nơi các công ty AI lấy phần lớn dữ liệu huấn luyện, đang trở nên tràn ngập nội dung do AI tạo ra. Các trang trại nội dung đang sử dụng AI để tạo ra tin tức giật gân. Các bot đang tràn ngập Reddit và X. Theo một ước tính, 90% web có thể được tạo ra bởi AI vào năm 2026.

Sự "ô nhiễm" này đã khiến việc lọc triệt để các kết quả của AI khỏi tập dữ liệu huấn luyện trở nên khó khăn. Heidy Khlaaf, trưởng khoa học gia AI tại viện phi lợi nhuận AI Now Institute, cho rằng việc tiết kiệm chi phí từ việc "chưng cất" kiến thức của một mô hình hiện có có thể hấp dẫn các nhà phát triển, bất kể rủi ro.

deepseek ai model says it is chatgpt

Tuy nhiên, điều đáng lo ngại hơn là khả năng DeepSeek V3, bằng cách hấp thụ và lặp lại một cách không phê phán các kết quả của GPT-4, có thể làm trầm trọng thêm một số thành kiến và khuyết điểm của mô hình này. Nếu DeepSeek V3 không thể tự xác định chính xác bản thân mình, thì làm sao người dùng có thể tin tưởng vào các câu trả lời khác của nó?

Sự xuất hiện của DeepSeek V3 đã đặt ra nhiều câu hỏi về đạo đức và trách nhiệm trong việc phát triển AI. Liệu việc sử dụng dữ liệu từ các mô hình đối thủ có phải là một chiêu trò đạo văn tinh vi, hay chỉ đơn giản là sự vô tình trong một thế giới web ngày càng bị chi phối bởi nội dung do AI tạo ra? Dù động cơ là gì, rõ ràng chúng ta cần phải cảnh giác hơn trong việc đánh giá và sử dụng các hệ thống AI, đặc biệt là khi ranh giới giữa thực và ảo ngày càng trở nên mờ nhạt.

Nguyễn Hải

 
Cùng chuyên mục

Samsung muốn trở thành người dẫn đầu về AI trong năm 2025

Thứ 6, 03/01/2025 10:16
Thời gian qua, Samsung đã có hàng loạt những bước tiến mới trong lĩnh vực AI.

Cha mẹ có IQ cao dạy con 3 ĐIỀU giúp cuộc đời suôn sẻ, thành công ngay từ điểm xuất phát: Trẻ lúc nào cũng vui vẻ, biết phấn đấu

Thứ 6, 03/01/2025 10:11
Đây là những bí quyết vàng của cha mẹ thông thái giúp con phát triển nhân cách, xây dựng thói quen tốt đảm bảo tương lai thành công.

Hành động siêu tinh tế của nàng WAG Chu Thanh Huyền khi đi cổ vũ chồng - CĐM chỉ để ý 1 chi tiết

Thứ 6, 03/01/2025 10:11
Cô nàng xuất hiện rạng rỡ, bế con đến cổ vũ chồng thi đấu.

Trump 2.0 đến gần: Cách tiếp cận khác biệt và "công cụ" đặc trưng; Điểm nhấn trong quan hệ với Việt Nam

Thứ 6, 03/01/2025 10:10
Hai năm đầu sẽ là lúc ông Trump quyết liệt triển khai những ưu tiên của mình. Và 100 ngày đầu nhậm chức sẽ đánh dấu ngay sự khác biệt của Trump.

Samsung ra mắt màn hình gaming OLED với tần số quét 500Hz "khủng" nhất từ trước đến nay

Thứ 6, 03/01/2025 09:55
Ngoài ra, Samsung còn trình làng hàng loạt các mẫu màn hình gaming mới thuộc dòng Odyssey, trong đó bao gồm màn hình gaming 3D không cần kính.
     
Nổi bật trong ngày

Từ nay, tỉnh phía Bắc giáp Trung Quốc, giàu top đầu Việt Nam chính thức có thành phố thứ 5

Thứ 5, 02/01/2025 08:10
Với 5 thành phố, tỉnh này chính thức trở thành một trong những tỉnh nhiều thành phố nhất Việt Nam.

Chip nhớ DDR5 Trung Quốc lớn hơn hàng Samsung tới 40%, bị nghi sản xuất trên dây chuyền "kém tiên tiến"?

Thứ 5, 02/01/2025 11:38
Nếu chính xác, công nghệ của CXMT hiện tại có thể được so sánh với các thế hệ chip DDR5 đầu tiên của Samsung, Micron và SK hynix vào năm 2021.

Cảnh sát bất ngờ khám xét căn biệt thự, tạm giữ Lê Thị Huyền Trân và 2 người khác

Thứ 5, 02/01/2025 16:04
Trong quá trình khám xét căn biệt thự, cơ quan công an phát hiện tại nhiều vị trí có cất giấu ma túy, thu 487 viên ma túy tổng hợp và hơn 1 kg ma túy Ketamin.

Xuân Son cho người Thái ôm hận, tuyển Việt Nam chấm dứt lời nguyền 27 năm!

Thứ 5, 02/01/2025 15:54
Đội tuyển Việt Nam vượt qua người Thái với tỷ số 2-1 trong trận chung kết lượt đi AFF Cup 2024.

Xem “Sex Education”, tôi nhớ về quãng thời gian đau khổ, tuyệt vọng đến mức trầm cảm vì bị bạn trai lừa dối

Thứ 5, 02/01/2025 09:03
Yêu bản thân giờ là ưu tiên hàng đầu trong cuộc sống của tôi.
xe.nguoiduatin.vn