Startup AI Trung Quốc làm choáng váng thế giới: Ra mắt mô hình AI mới, mạnh ngang ChatGPT, có thể chấm dứt cơn khát GPU NVIDIA cao cấp của Trung Quốc

Startup AI Trung Quốc làm choáng váng thế giới: Ra mắt mô hình AI mới, mạnh ngang ChatGPT, có thể chấm dứt cơn khát GPU NVIDIA cao cấp của Trung Quốc

Thứ 2, 30/12/2024 12:38
Quan trọng hơn, mô hình AI này có thể được huấn luyện mà không cần đến các GPU cao cấp của NVIDIA, vốn bị cấm xuất khẩu sang Trung Quốc.

Trong một bước tiến ấn tượng, DeepSeek, công ty khởi nghiệp có trụ sở tại Hàng Châu, Trung Quốc, đã trình làng mô hình ngôn ngữ lớn (LLM) mới mang tên DeepSeek V3. Điều đáng chú ý là mô hình này đã vượt qua các đối thủ nặng ký của Meta Platforms và OpenAI trong những bài kiểm tra hiệu năng, cho dù có chi phí huấn luyện thấp hơn đáng kể.

Trong một bài đăng trên WeChat vào thứ Năm, DeepSeek tiết lộ rằng mô hình DeepSeek V3 mới sở hữu 671 tỷ tham số và chỉ mất khoảng 2 tháng để huấn luyện với chi phí 5,58 triệu USD, sử dụng ít tài nguyên tính toán hơn đáng kể so với các mô hình được phát triển bởi các công ty công nghệ lớn hơn. Các mô hình LLM là công nghệ nền tảng cho các công cụ AI tạo sinh như ChatGPT. Trong AI, số lượng tham số cao đóng vai trò quan trọng, cho phép LLM thích ứng với các mẫu dữ liệu phức tạp hơn và đưa ra dự đoán chính xác hơn.

68461dd2 b454 42e5 b281 e62fe7bf65c133f5c6da
DeepSeek, startup AI mới nổi của Trung Quốc 

Ngay cả Andrej Karpathy, nhà khoa học máy tính và là thành viên nhóm sáng lập OpenAI, đã bày tỏ sự ngạc nhiên trước báo cáo kỹ thuật về mô hình AI mới của DeepSeek. Trong một bài đăng trên nền tảng X, ông viết: "DeepSeek làm cho nó trông dễ dàng với việc phát hành một LLM hàng đầu với ngân sách huấn luyện gần như không đáng kể."

Đáng chú ý, mô hình V3 được huấn luyện với chỉ 2,78 triệu giờ GPU, tức là tổng thời gian sử dụng bộ xử lý đồ họa để huấn luyện một LLM. Hơn thế nữa quá trình này sử dụng GPU H800 của NVIDIA, vốn được thiết kế riêng cho Trung Quốc và có hiệu năng thấp hơn.

Con số này thấp hơn đáng kể so với 30,8 triệu giờ GPU mà Llama 3.1 của Meta cần để huấn luyện trên GPU H100 tiên tiến hơn của NVIDIA, loại chip vốn không được phép xuất khẩu sang Trung Quốc.

screenshot2024 12 27at10741pm
Kích thước của DeepSeek V3 ngang ngửa với các mô hình AI hàng đầu thế giới hiện nay, nhưng chi phí huấn luyện thấp hơn đáng kể

Báo cáo kỹ thuật về V3 cho thấy LLM này vượt trội hơn Llama 3.1 của Meta và Qwen 2.5 của Alibaba Group Holding trong một loạt các bài kiểm tra đánh giá khả năng hiểu và tạo văn bản, kiến thức chuyên gia, lập trình và giải quyết vấn đề toán học.

Bên cạnh đó, kết quả benchmark của V3 cũng cho thấy nó có thể sánh ngang với mô hình GPT-4o của OpenAI và Claude 3.5 Sonnet của Anthropic, các mô hình AI hàng đầu thế giới hiện nay.

Sự ra đời của DeepSeek V3 cho thấy các công ty AI Trung Quốc đã tiến bộ như thế nào, bất chấp các lệnh trừng phạt của Mỹ đã chặn quyền truy cập của họ vào các bán dẫn tiên tiến được sử dụng để huấn luyện mô hình. Bằng cách tận dụng kiến trúc mới được thiết kế để đạt được hiệu quả chi phí trong quá trình huấn luyện, DeepSeek đã chứng minh rằng việc phát triển một LLM mạnh mẽ không nhất thiết phải đòi hỏi nguồn vốn khổng lồ như các công ty lớn thường đầu tư.

nvidiah800nvlink80g8gpunvlink8mo dunnividamaychuh800
Việc huấn luyện V3 được thực hiện hoàn toàn trên GPU H800 của NVIDIA, GPU được phép xuất khẩu sang Trung Quốc 

DeepSeek được tách ra từ High-Flyer Quant vào tháng 7 năm ngoái, công ty sử dụng AI để vận hành một trong những quỹ đầu cơ định lượng lớn nhất ở Trung Quốc. High-Flyer đã chi 200 triệu nhân dân tệ (27,4 triệu USD) để phát triển cụm AI Fire Flyer I trong giai đoạn 2019-2020, và sau đó chi thêm 1 tỷ nhân dân tệ để xây dựng Fire-Flyer II.

Trong một thông báo vào tháng 4 năm ngoái, High-Flyer cho biết mục tiêu phát triển của DeepSeek là tạo ra "AI sẽ mang lại lợi ích cho toàn nhân loại". Trước đó, DeepSeek đã ra mắt một loạt các mô hình AI, được các nhà phát triển sử dụng để xây dựng các ứng dụng của bên thứ ba, cũng như chatbot của riêng mình.

Với DeepSeek V3, công ty khởi nghiệp Trung Quốc đã chứng tỏ rằng việc phát triển các mô hình AI tiên tiến không còn là sân chơi riêng của các gã khổng lồ công nghệ. Thành tích này hứa hẹn sẽ thúc đẩy sự cạnh tranh và đổi mới trong ngành, đồng thời mở ra cơ hội cho các công ty nhỏ hơn tham gia vào cuộc đua AI. Điều này cũng đặt ra câu hỏi về vai trò của Trung Quốc trong tương lai của AI, khi quốc gia này đang nỗ lực vượt qua các rào cản để trở thành một cường quốc về công nghệ.

Nguyễn Hải

Cùng chuyên mục

Nhìn mỹ nam này phải thốt lên “Hoàng tử thời dân quốc”: Khí chất vương giả ăn vào máu, đẹp không chừa phần ai

Thứ 6, 19/12/2025 22:03
Chỉ với vài khung hình hậu trường trong quân phục thời dân quốc, cưỡi ngựa giữa bối cảnh khói lửa, mỹ nam này đã khiến mạng xã hội dậy sóng.

"Người hùng" U22 Việt Nam Thanh Nhàn về nước trong vòng tay người hâm mộ: "Đông quá ạ, thật sự rất tuyệt vời"

Thứ 6, 19/12/2025 21:44
Tiền đạo Nguyễn Thanh Nhàn vẫn còn "rất sướng" với bàn thắng vào lưới Thái Lan, hạnh phúc khi được chào đón trở về.

Chỉ còn 1 ngày đến WeYoung 2025: Cả loạt fandom hot nhất tập hợp, văn hoá thần tượng Việt ngày càng đẹp rực rỡ!

Thứ 6, 19/12/2025 21:30
Chỉ còn 1 ngày đến WeYoung 2025, các fandom hiện đang vui hơn bao giờ hết.

Bảng tổng sắp huy chương SEA Games 33 ngày 19/12: Thái Lan chính thức phá "siêu kỷ lục" của Việt Nam

Thứ 6, 19/12/2025 20:41
Đoàn Thái Lan đã thiết lập kỷ lục mới của SEA Games.

Cặp sao Việt công khai bồng bế nhau gây bão MXH: Nhà gái xinh như mộng, nhà trai lộ rõ vẻ si mê khó chối cãi

Thứ 6, 19/12/2025 20:10
Khoảnh khắc tình tứ của 2 mỹ nam mỹ nữ này khiến cộng đồng mạng xôn xao không ngớt.
     
Nổi bật trong ngày

CĐV Việt Nam hát vang Quốc ca lúc trao HCB cho thầy trò HLV Mai Đức Chung

Thứ 5, 18/12/2025 05:52
Trong lòng người hâm mộ Việt Nam, các cô gái vàng của tuyển bóng đá nữ vẫn luôn xứng đáng được coi là nhà vô địch SEA Games.

324 chủ xe máy vượt đèn đỏ có biển số sau nhanh chóng nộp phạt nguội theo Nghị định 168

Thứ 5, 18/12/2025 13:47
Những chủ xe máy có trong danh sách dưới đây cần sớm kiểm tra thông tin.

Từ nông sản “được mùa mất giá” đến thương hiệu gia vị bản địa: Bài toán tăng trưởng của CEO Võ Thị Lệ - HTX Nông nghiệp Gò Nổi

Thứ 5, 18/12/2025 16:52
Giữa làn sóng khởi nghiệp công nghệ và thương mại số, Võ Thị Lệ chọn cho mình một hướng đi khác: trở về quê hương để bắt đầu lại từ nông sản bản địa. Không phải bằng những kế hoạch tăng trưởng nhanh, mà bằng một câu hỏi rất đời: vì sao nông sản quê mình làm ra vất vả nhưng giá trị lại quá mong manh?

Ngược dòng kinh điển trước Thái Lan, U22 Việt Nam giành HCV SEA Games 33

Thứ 5, 18/12/2025 15:29
Trận đấu U22 Việt Nam vs U22 Thái Lan diễn ra lúc 19h30 ngày 18/12 thuộc khuôn khổ vòng chung kết môn bóng đá nam SEA Games 33.

Fanpage Bộ Công an post 1 ảnh “nhắc khéo” người dân trong đêm Việt Nam vô địch

Thứ 5, 18/12/2025 23:18
Trong đêm U22 Việt Nam vô địch SEA Games 33, fanpage Bộ Công an “nhắc khéo” người dân đi bão vui thôi đừng quá, khi hệ thống camera AI vẫn hoạt động 24/24.
xe.nguoiduatin.vn