Startup AI Trung Quốc làm choáng váng thế giới: Ra mắt mô hình AI mới, mạnh ngang ChatGPT, có thể chấm dứt cơn khát GPU NVIDIA cao cấp của Trung Quốc

Startup AI Trung Quốc làm choáng váng thế giới: Ra mắt mô hình AI mới, mạnh ngang ChatGPT, có thể chấm dứt cơn khát GPU NVIDIA cao cấp của Trung Quốc

Thứ 2, 30/12/2024 12:38
Quan trọng hơn, mô hình AI này có thể được huấn luyện mà không cần đến các GPU cao cấp của NVIDIA, vốn bị cấm xuất khẩu sang Trung Quốc.

Trong một bước tiến ấn tượng, DeepSeek, công ty khởi nghiệp có trụ sở tại Hàng Châu, Trung Quốc, đã trình làng mô hình ngôn ngữ lớn (LLM) mới mang tên DeepSeek V3. Điều đáng chú ý là mô hình này đã vượt qua các đối thủ nặng ký của Meta Platforms và OpenAI trong những bài kiểm tra hiệu năng, cho dù có chi phí huấn luyện thấp hơn đáng kể.

Trong một bài đăng trên WeChat vào thứ Năm, DeepSeek tiết lộ rằng mô hình DeepSeek V3 mới sở hữu 671 tỷ tham số và chỉ mất khoảng 2 tháng để huấn luyện với chi phí 5,58 triệu USD, sử dụng ít tài nguyên tính toán hơn đáng kể so với các mô hình được phát triển bởi các công ty công nghệ lớn hơn. Các mô hình LLM là công nghệ nền tảng cho các công cụ AI tạo sinh như ChatGPT. Trong AI, số lượng tham số cao đóng vai trò quan trọng, cho phép LLM thích ứng với các mẫu dữ liệu phức tạp hơn và đưa ra dự đoán chính xác hơn.

68461dd2 b454 42e5 b281 e62fe7bf65c133f5c6da
DeepSeek, startup AI mới nổi của Trung Quốc 

Ngay cả Andrej Karpathy, nhà khoa học máy tính và là thành viên nhóm sáng lập OpenAI, đã bày tỏ sự ngạc nhiên trước báo cáo kỹ thuật về mô hình AI mới của DeepSeek. Trong một bài đăng trên nền tảng X, ông viết: "DeepSeek làm cho nó trông dễ dàng với việc phát hành một LLM hàng đầu với ngân sách huấn luyện gần như không đáng kể."

Đáng chú ý, mô hình V3 được huấn luyện với chỉ 2,78 triệu giờ GPU, tức là tổng thời gian sử dụng bộ xử lý đồ họa để huấn luyện một LLM. Hơn thế nữa quá trình này sử dụng GPU H800 của NVIDIA, vốn được thiết kế riêng cho Trung Quốc và có hiệu năng thấp hơn.

Con số này thấp hơn đáng kể so với 30,8 triệu giờ GPU mà Llama 3.1 của Meta cần để huấn luyện trên GPU H100 tiên tiến hơn của NVIDIA, loại chip vốn không được phép xuất khẩu sang Trung Quốc.

screenshot2024 12 27at10741pm
Kích thước của DeepSeek V3 ngang ngửa với các mô hình AI hàng đầu thế giới hiện nay, nhưng chi phí huấn luyện thấp hơn đáng kể

Báo cáo kỹ thuật về V3 cho thấy LLM này vượt trội hơn Llama 3.1 của Meta và Qwen 2.5 của Alibaba Group Holding trong một loạt các bài kiểm tra đánh giá khả năng hiểu và tạo văn bản, kiến thức chuyên gia, lập trình và giải quyết vấn đề toán học.

Bên cạnh đó, kết quả benchmark của V3 cũng cho thấy nó có thể sánh ngang với mô hình GPT-4o của OpenAI và Claude 3.5 Sonnet của Anthropic, các mô hình AI hàng đầu thế giới hiện nay.

Sự ra đời của DeepSeek V3 cho thấy các công ty AI Trung Quốc đã tiến bộ như thế nào, bất chấp các lệnh trừng phạt của Mỹ đã chặn quyền truy cập của họ vào các bán dẫn tiên tiến được sử dụng để huấn luyện mô hình. Bằng cách tận dụng kiến trúc mới được thiết kế để đạt được hiệu quả chi phí trong quá trình huấn luyện, DeepSeek đã chứng minh rằng việc phát triển một LLM mạnh mẽ không nhất thiết phải đòi hỏi nguồn vốn khổng lồ như các công ty lớn thường đầu tư.

nvidiah800nvlink80g8gpunvlink8mo dunnividamaychuh800
Việc huấn luyện V3 được thực hiện hoàn toàn trên GPU H800 của NVIDIA, GPU được phép xuất khẩu sang Trung Quốc 

DeepSeek được tách ra từ High-Flyer Quant vào tháng 7 năm ngoái, công ty sử dụng AI để vận hành một trong những quỹ đầu cơ định lượng lớn nhất ở Trung Quốc. High-Flyer đã chi 200 triệu nhân dân tệ (27,4 triệu USD) để phát triển cụm AI Fire Flyer I trong giai đoạn 2019-2020, và sau đó chi thêm 1 tỷ nhân dân tệ để xây dựng Fire-Flyer II.

Trong một thông báo vào tháng 4 năm ngoái, High-Flyer cho biết mục tiêu phát triển của DeepSeek là tạo ra "AI sẽ mang lại lợi ích cho toàn nhân loại". Trước đó, DeepSeek đã ra mắt một loạt các mô hình AI, được các nhà phát triển sử dụng để xây dựng các ứng dụng của bên thứ ba, cũng như chatbot của riêng mình.

Với DeepSeek V3, công ty khởi nghiệp Trung Quốc đã chứng tỏ rằng việc phát triển các mô hình AI tiên tiến không còn là sân chơi riêng của các gã khổng lồ công nghệ. Thành tích này hứa hẹn sẽ thúc đẩy sự cạnh tranh và đổi mới trong ngành, đồng thời mở ra cơ hội cho các công ty nhỏ hơn tham gia vào cuộc đua AI. Điều này cũng đặt ra câu hỏi về vai trò của Trung Quốc trong tương lai của AI, khi quốc gia này đang nỗ lực vượt qua các rào cản để trở thành một cường quốc về công nghệ.

Nguyễn Hải

Cùng chuyên mục

Cắt trang bị để thêm bản ‘giá rẻ’ - Chiến lược ‘câu khách’ mới của nhiều mẫu xe tại Việt Nam năm nay

Thứ 7, 13/12/2025 07:30
Trong năm 2025, một số hãng xe tại Việt Nam bổ sung phiên bản giá thấp bằng cách cắt bớt trang bị, từ đó hạ giá khởi điểm và mở rộng tệp khách hàng tiềm năng.

Tin gió mùa đông bắc: Miền Bắc trời chuyển rét đậm, có nơi dưới 5 độ, nhiều nơi mưa to

Thứ 7, 13/12/2025 06:41
Hà Nội ban ngày có mưa vừa, mưa to và rải rác có dông; đêm có mưa rào vài nơi. Gió đông bắc mạnh dần lên cấp 3-4. Trời rét.

[DIỄN BIẾN] SEA Games 33 (13/12): Nguyễn Thị Oanh xuất trận, Huy Hoàng nhắm “hat-trick” HCV

Thứ 7, 13/12/2025 06:30
13/12 tiếp tục là một trong những ngày thi đấu trọng tâm của đoàn Thể thao Việt Nam tại SEA Games 33, khi hàng loạt nội dung quyết định diễn ra trong hơn 12 giờ thi đấu.

Lịch thi đấu SEA Games 33 ngày 13/12: Thêm "mưa vàng" cho Thể thao Việt Nam?

Thứ 7, 13/12/2025 06:09
Trong ngày thi đấu 13/12, Thể thao Việt Nam sẽ có thêm 31 cơ hội giành HCV.

Lịch thi đấu SEA Games ngày 13/12: Nữ hoàng điền kinh Nguyễn Thị Oanh xuất trận

Thứ 7, 13/12/2025 01:34
Cập nhật lịch thi đấu SEA Games 33 ngày 13/12 của Đoàn thể thao Việt Nam.
     
Nổi bật trong ngày

Shopee cũng có "Shopping Wrap": Xem ngay đơn hàng đầu đời, đơn đắt nhất, tổng số tiền đã tiết kiệm của bạn qua bao năm qua là bao nhiêu

Thứ 6, 12/12/2025 01:03
Đây là cách để bạn nhìn lại hành trình mua sắm của bản thân kể từ ngày đầu tiên mua hàng trên Shopee.

Quyết định đặc biệt quan trọng ảnh hưởng đến tất cả ô tô, xe máy xăng toàn quốc, ai cũng phải biết

Thứ 6, 12/12/2025 11:38
Phó Thủ tướng vừa ký quyết định "mở đường" cho lộ trình mới.

“Tôi chỉ ngại mỗi trọng tài”: Võ sĩ Việt Nam đánh cho đối thủ Thái Lan “xây xẩm”, giành HCV SEA Games

Thứ 6, 12/12/2025 16:22
Tuyển karate Việt Nam vỡ òa sau chiến thắng quý giá ở chung kết trước chủ nhà Thái Lan.

Chạm vào những “bí mật” chưa từng hé lộ của Vịnh Hạ Long – Nơi vẻ đẹp nguyên sơ gặp gỡ trải nghiệm thượng lưu

Thứ 6, 12/12/2025 21:47
Trải nghiệm kỳ quan ẩn mình giữa Vịnh Di Sản", mời gọi du khách khám phá Di sản Thiên nhiên Thế giới của Việt Nam từng hai lần được UNESCO vinh danh.

Cơ hội nâng cấp đồ điện tử tạm biêt năm cũ: SmartTV 4K hãng TCL chỉ từ 10 triệu, máy lọc không khí Sunhouse rẻ sốc và nhiều đồ xịn giá thơm khác

Thứ 6, 12/12/2025 01:29
Loạt thiết bị gia dụng đáng chú ý, mang lại trải nghiệm sử dụng tiện lợi trong không gian sống hiện đại, phù hợp nhiều nhu cầu khác nhau từ giải trí đến bếp núc và chăm sóc nhà cửa, chưa kể còn đang nhận mức giảm đến 50%.
xe.nguoiduatin.vn