Không phải 6 triệu USD, DeepSeek cần tiêu tốn ít nhất 500 triệu USD để phát triển mô hình AI

Không phải 6 triệu USD, DeepSeek cần tiêu tốn ít nhất 500 triệu USD để phát triển mô hình AI

Chủ nhật, 02/02/2025 16:44
Thậm chí báo cáo của SemiAnalysis còn cho rằng, chi phí của DeepSeek có thể còn lên tới 1,6 tỷ USD khi phát triển mô hình AI của mình.

DeepSeek, startup AI của Trung Quốc, đã trở thành tâm điểm của giới công nghệ trong tuần này, với sự chú ý đổ dồn vào một con số duy nhất: 6 triệu USD. Trong bài báo về mô hình AI mới nhất của mình, DeepSeek cho biết tổng chi phí huấn luyện chỉ vỏn vẹn 5,576 triệu USD, dựa trên giá thuê các GPU của NVIDIA.

Tuy nhiên, họ cũng đưa ra một điều kiện rõ ràng rằng con số này chỉ bao gồm quá trình "huấn luyện chính thức" của mô hình, không tính đến các chi phí liên quan đến "nghiên cứu trước đó và thử nghiệm loại bỏ về kiến trúc, thuật toán hay dữ liệu".

Đầu tuần này, trợ lý AI của DeepSeek đã soán ngôi vị ứng dụng miễn phí được tải nhiều nhất tại Mỹ trên App Store của Apple, vượt qua ChatGPT của OpenAI. Thị trường chứng khoán công nghệ toàn cầu đã chao đảo, với các nhà sản xuất chip như NVIDIA và Broadcom mất tổng cộng 800 tỷ USD vốn hóa thị trường vào thứ Hai.

1738047877 0145
Chỉ trong một tuần, DeepSeek đã làm giới công nghệ Mỹ chao đảo

Một báo cáo mới từ SemiAnalysis, công ty nghiên cứu và tư vấn về bán dẫn, đã cung cấp thêm các ước tính về chi phí của DeepSeek. Công ty này ước tính rằng chi phí phần cứng của DeepSeek "cao hơn nhiều so với 500 triệu USD tính trong toàn bộ lịch sử công ty", đồng thời nhấn mạnh rằng chi phí R&D và tổng chi phí sở hữu cũng rất đáng kể. Việc tạo ra "dữ liệu tổng hợp" để mô hình huấn luyện sẽ đòi hỏi "một lượng tính toán đáng kể", SemiAnalysis cho biết.

Báo cáo cũng chỉ ra rằng chi phí để huấn luyện mô hình Claude 3.5 Sonnet từ Anthropic lên tới "hàng chục triệu USD", nhưng lưu ý rằng Anthropic đã huy động được hàng tỷ USD từ Amazon và Google, một dấu hiệu cho thấy cần thêm nhiều tiền hơn nữa để vận hành các mô hình và công ty. "Đó là bởi vì họ phải thử nghiệm, đưa ra các kiến trúc mới, thu thập và làm sạch dữ liệu, trả lương nhân viên, và nhiều thứ khác nữa", SemiAnalysis giải thích.

Theo SemiAnalysis, con số này có thể lên tới 1,6 tỷ USD: “Phân tích của chúng tôi cho thấy tổng chi phí vốn máy chủ cho DeepSeek là xấp xỉ 1,6 tỷ USD, với một phần đáng kể lên tới 944 triệu USD liên quan đến việc vận hành các cụm như vậy.”

Chính bài báo của DeepSeek cũng không đưa ra ước tính về chi phí tính toán của họ. Công ty chưa ngay lập tức phản hồi yêu cầu bình luận. "Rõ ràng DeepSeek là duy nhất ở chỗ họ đạt được mức chi phí và năng lực này đầu tiên", SemiAnalysts viết. Công ty này cũng bổ sung rằng R1 của DeepSeek "là một mô hình rất tốt" và việc "bắt kịp được năng lực lập luận nhanh đến vậy là rất ấn tượng".

Các chuyên gia và nhà phân tích trong tuần này đã ca ngợi chất lượng mô hình của DeepSeek, đồng thời chỉ ra điều này ấn tượng như thế nào khi xét đến việc Mỹ đã 3 lần hạn chế xuất khẩu chip sang Trung Quốc trong 3 năm qua. Điều này dẫn đến lo ngại rằng Mỹ đang tụt lại phía sau đối thủ chính của mình trong một thị trường được dự báo sẽ vượt quá 1 nghìn tỷ USD doanh thu trong vòng một thập kỷ tới.

1440x810cmsv20d42e762 e8da 5e16 9d2d 867754ed26e6 9011914

DeepSeek được thành lập năm 2023 bởi Lương Văn Phong, đồng sáng lập quỹ đầu cơ định lượng High-Flyer, tập trung vào AI. Theo các nhà phân tích tại Jefferies, công ty khởi nghiệp AI này được cho là tách ra từ đơn vị nghiên cứu AI của quỹ đầu cơ vào tháng 4/2023 để tập trung vào các mô hình ngôn ngữ lớn và theo đuổi trí tuệ nhân tạo phổ quát (AGI) - một nhánh của AI có khả năng ngang bằng hoặc vượt trội hơn trí tuệ con người trong nhiều tác vụ, mục tiêu mà OpenAI và các công ty khác cũng đang theo đuổi. DeepSeek vẫn hoàn toàn thuộc sở hữu và được tài trợ bởi High-Flyer.

Sự quan tâm xung quanh DeepSeek bắt đầu tăng mạnh từ đầu tháng này, khi công ty khởi nghiệp ra mắt R1, một mô hình suy luận cạnh tranh với o1 của OpenAI. Đây là một mô hình mã nguồn mở, có nghĩa là bất kỳ nhà phát triển AI nào cũng có thể sử dụng. Tương tự như các chatbot Trung Quốc khác, DeepSeek cũng có những hạn chế về một số chủ đề nhất định: Chẳng hạn, khi được hỏi về chính trị, DeepSeek được cho là đã hướng người dùng tránh xa những câu hỏi tương tự.

CEO của OpenAI, Sam Altman, đã công khai khen ngợi mô hình này, nhưng công ty cũng cho biết họ tin rằng có bằng chứng cho thấy DeepSeek đã thu thập dữ liệu của OpenAI một cách không đúng đắn để xây dựng sản phẩm. Tại một sự kiện ở Washington, D.C., vào thứ Năm do OpenAI tổ chức, Altman nói rằng DeepSeek "rõ ràng là một mô hình tuyệt vời". "Đây là lời nhắc nhở về mức độ cạnh tranh và sự cần thiết để AI đại chúng chiến thắng", ông nói. Ông cũng chỉ ra "mức độ quan tâm đến khả năng suy luận, mức độ quan tâm đến mã nguồn mở".

Nguyễn Hải

Cùng chuyên mục

Khó thở, nôn mửa sau livestream: Cái giá phải trả để được "nhìn thấy" trong nền kinh tế chú ý

Thứ 5, 09/04/2026 17:15
Những người làm việc trong nền kinh tế chú ý phải liên tục thích nghi: nền tảng mới, định dạng mới, áp lực mới và những cách thức mới để được nhìn thấy.

Hà Nội: Phát hiện thi thể nam giới khoảng 30 tuổi trên sông Hồng đoạn gần cầu Vĩnh Tuy

Thứ 5, 09/04/2026 17:10
Thi thể nạn nhân sau đó được đưa vào bờ, bàn giao cho Công an phường Lĩnh Nam.

Giá dầu quay đầu tăng sau khi giảm mạnh nhất 6 năm, Iran cáo buộc Mỹ vi phạm thỏa thuận

Thứ 5, 09/04/2026 17:09
Giá dầu thế giới ghi nhận đà tăng trong phiên giao dịch ngày 9/4.

Tin vui 2026: Đối tượng nào được tăng lương hưu 15%?

Thứ 5, 09/04/2026 17:02
Lương hưu năm 2026 tiếp tục tăng 15% cho nhiều nhóm đối tượng, không phải ai cũng nắm rõ.

Sinh viên lên năm 3, phụ huynh vẫn nhắn nhờ bạn để ý, đốc thúc học giúp: "Cứ tưởng chỉ có trên truyện audio"

Thứ 5, 09/04/2026 16:50
Một sinh viên rơi vào tình huống khó xử khi liên tục nhận được tin nhắn từ phụ huynh của bạn cùng lớp.
     
Nổi bật trong ngày

Không chỉ liên tục khuyến mại, Mitsubishi còn muốn tạo cú hích doanh số bằng cách này tại Việt Nam

Thứ 4, 08/04/2026 05:47
Mitsubishi tổ chức sự kiện dã ngoại Star Camp 2026, phản ánh xu hướng các hãng xe tại Việt Nam mở rộng hoạt động cộng đồng bên cạnh việc duy trì doanh số.

Nắng nóng mới chớm, 1 nhóm bệnh đã tăng vọt 20%: Bác sĩ cảnh báo điều nhiều người đang chủ quan

Thứ 4, 08/04/2026 10:03
Những ngày đầu hè, khi nền nhiệt tại miền Bắc liên tục chạm ngưỡng 36–37 độ C, lượng bệnh nhân đến khám các bệnh lý về da tại Bệnh viện Da liễu Trung ương bắt đầu tăng.

Sinh vật bí ẩn phá nát vườn chuối suốt 2 tuần: 60 người truy tìm khi camera nhiệt ghi lại bóng dáng lạ

Thứ 4, 08/04/2026 13:00
Những cây chuối bị xé rách, gãy đôi giữa đêm kéo theo một nỗi bất an lớn hơn: thứ đang lẩn khuất ngoài vườn rốt cuộc là sinh vật gì?

Ai đang “đu trend” bánh trứng kiến cần biết điều này sớm

Thứ 4, 08/04/2026 14:34
Từ một món ăn dân dã của đồng bào vùng cao, bánh trứng kiến bất ngờ trở thành “hiện tượng mạng” thời gian gần đây.

Kỹ sư Nga tạo đột phá tại "kho báu năng lượng" khổng lồ ở Bắc Cực; Thế giới chưa từng khai thác được

Thứ 4, 08/04/2026 15:42
"Kho báu" này có tiềm năng trở thành nguồn năng lượng khổng lồ của nhân loại.
xe.nguoiduatin.vn