Không phải 6 triệu USD, DeepSeek cần tiêu tốn ít nhất 500 triệu USD để phát triển mô hình AI

Không phải 6 triệu USD, DeepSeek cần tiêu tốn ít nhất 500 triệu USD để phát triển mô hình AI

Chủ nhật, 02/02/2025 16:44
Thậm chí báo cáo của SemiAnalysis còn cho rằng, chi phí của DeepSeek có thể còn lên tới 1,6 tỷ USD khi phát triển mô hình AI của mình.

DeepSeek, startup AI của Trung Quốc, đã trở thành tâm điểm của giới công nghệ trong tuần này, với sự chú ý đổ dồn vào một con số duy nhất: 6 triệu USD. Trong bài báo về mô hình AI mới nhất của mình, DeepSeek cho biết tổng chi phí huấn luyện chỉ vỏn vẹn 5,576 triệu USD, dựa trên giá thuê các GPU của NVIDIA.

Tuy nhiên, họ cũng đưa ra một điều kiện rõ ràng rằng con số này chỉ bao gồm quá trình "huấn luyện chính thức" của mô hình, không tính đến các chi phí liên quan đến "nghiên cứu trước đó và thử nghiệm loại bỏ về kiến trúc, thuật toán hay dữ liệu".

Đầu tuần này, trợ lý AI của DeepSeek đã soán ngôi vị ứng dụng miễn phí được tải nhiều nhất tại Mỹ trên App Store của Apple, vượt qua ChatGPT của OpenAI. Thị trường chứng khoán công nghệ toàn cầu đã chao đảo, với các nhà sản xuất chip như NVIDIA và Broadcom mất tổng cộng 800 tỷ USD vốn hóa thị trường vào thứ Hai.

1738047877 0145
Chỉ trong một tuần, DeepSeek đã làm giới công nghệ Mỹ chao đảo

Một báo cáo mới từ SemiAnalysis, công ty nghiên cứu và tư vấn về bán dẫn, đã cung cấp thêm các ước tính về chi phí của DeepSeek. Công ty này ước tính rằng chi phí phần cứng của DeepSeek "cao hơn nhiều so với 500 triệu USD tính trong toàn bộ lịch sử công ty", đồng thời nhấn mạnh rằng chi phí R&D và tổng chi phí sở hữu cũng rất đáng kể. Việc tạo ra "dữ liệu tổng hợp" để mô hình huấn luyện sẽ đòi hỏi "một lượng tính toán đáng kể", SemiAnalysis cho biết.

Báo cáo cũng chỉ ra rằng chi phí để huấn luyện mô hình Claude 3.5 Sonnet từ Anthropic lên tới "hàng chục triệu USD", nhưng lưu ý rằng Anthropic đã huy động được hàng tỷ USD từ Amazon và Google, một dấu hiệu cho thấy cần thêm nhiều tiền hơn nữa để vận hành các mô hình và công ty. "Đó là bởi vì họ phải thử nghiệm, đưa ra các kiến trúc mới, thu thập và làm sạch dữ liệu, trả lương nhân viên, và nhiều thứ khác nữa", SemiAnalysis giải thích.

Theo SemiAnalysis, con số này có thể lên tới 1,6 tỷ USD: “Phân tích của chúng tôi cho thấy tổng chi phí vốn máy chủ cho DeepSeek là xấp xỉ 1,6 tỷ USD, với một phần đáng kể lên tới 944 triệu USD liên quan đến việc vận hành các cụm như vậy.”

Chính bài báo của DeepSeek cũng không đưa ra ước tính về chi phí tính toán của họ. Công ty chưa ngay lập tức phản hồi yêu cầu bình luận. "Rõ ràng DeepSeek là duy nhất ở chỗ họ đạt được mức chi phí và năng lực này đầu tiên", SemiAnalysts viết. Công ty này cũng bổ sung rằng R1 của DeepSeek "là một mô hình rất tốt" và việc "bắt kịp được năng lực lập luận nhanh đến vậy là rất ấn tượng".

Các chuyên gia và nhà phân tích trong tuần này đã ca ngợi chất lượng mô hình của DeepSeek, đồng thời chỉ ra điều này ấn tượng như thế nào khi xét đến việc Mỹ đã 3 lần hạn chế xuất khẩu chip sang Trung Quốc trong 3 năm qua. Điều này dẫn đến lo ngại rằng Mỹ đang tụt lại phía sau đối thủ chính của mình trong một thị trường được dự báo sẽ vượt quá 1 nghìn tỷ USD doanh thu trong vòng một thập kỷ tới.

1440x810cmsv20d42e762 e8da 5e16 9d2d 867754ed26e6 9011914

DeepSeek được thành lập năm 2023 bởi Lương Văn Phong, đồng sáng lập quỹ đầu cơ định lượng High-Flyer, tập trung vào AI. Theo các nhà phân tích tại Jefferies, công ty khởi nghiệp AI này được cho là tách ra từ đơn vị nghiên cứu AI của quỹ đầu cơ vào tháng 4/2023 để tập trung vào các mô hình ngôn ngữ lớn và theo đuổi trí tuệ nhân tạo phổ quát (AGI) - một nhánh của AI có khả năng ngang bằng hoặc vượt trội hơn trí tuệ con người trong nhiều tác vụ, mục tiêu mà OpenAI và các công ty khác cũng đang theo đuổi. DeepSeek vẫn hoàn toàn thuộc sở hữu và được tài trợ bởi High-Flyer.

Sự quan tâm xung quanh DeepSeek bắt đầu tăng mạnh từ đầu tháng này, khi công ty khởi nghiệp ra mắt R1, một mô hình suy luận cạnh tranh với o1 của OpenAI. Đây là một mô hình mã nguồn mở, có nghĩa là bất kỳ nhà phát triển AI nào cũng có thể sử dụng. Tương tự như các chatbot Trung Quốc khác, DeepSeek cũng có những hạn chế về một số chủ đề nhất định: Chẳng hạn, khi được hỏi về chính trị, DeepSeek được cho là đã hướng người dùng tránh xa những câu hỏi tương tự.

CEO của OpenAI, Sam Altman, đã công khai khen ngợi mô hình này, nhưng công ty cũng cho biết họ tin rằng có bằng chứng cho thấy DeepSeek đã thu thập dữ liệu của OpenAI một cách không đúng đắn để xây dựng sản phẩm. Tại một sự kiện ở Washington, D.C., vào thứ Năm do OpenAI tổ chức, Altman nói rằng DeepSeek "rõ ràng là một mô hình tuyệt vời". "Đây là lời nhắc nhở về mức độ cạnh tranh và sự cần thiết để AI đại chúng chiến thắng", ông nói. Ông cũng chỉ ra "mức độ quan tâm đến khả năng suy luận, mức độ quan tâm đến mã nguồn mở".

Nguyễn Hải

Cùng chuyên mục

Đăng ký tạm trú: Có bắt buộc cung cấp bản photo sổ đỏ nhà thuê?

Thứ 5, 25/12/2025 17:47
Cổng Thông tin điện tử thành phố Hà Nội vừa đăng tải nội dung trả lời phản ánh của người dân liên quan đến thủ tục đăng ký tạm trú, trong đó có thắc mắc về việc có yêu cầu bắt buộc cung cấp sổ đỏ của nhà cho thuê hay không.

8 tuổi tốt nghiệp THPT, học xong cử nhân trong 8 tháng, 15 tuổi lấy bằng tiến sĩ: Thiên tài thẳng thừng từ chối lời mời của Mỹ, Trung Quốc, nhắm mục tiêu ‘tham vọng’

Thứ 5, 25/12/2025 17:10
Hồ sơ của trường đại học xác nhận thiên tài trẻ tuổi đã bảo vệ luận án công khai vào ngày 17/11/2025, khi vừa tròn 15 tuổi.

Cầu thủ nhập tịch Malaysia bị tố lén “qua mặt” FIFA, đối diện nguy cơ tăng nặng án phạt

Thứ 5, 25/12/2025 17:06
Cầu thủ nhập tịch Malaysia Imanol Machuca có thể đối mặt với rắc rối.

Nga bước một chân vào khoa học viễn tưởng: Tung công nghệ ‘bánh xe quay’ khổng lồ ngoài vũ trụ, tham vọng giải quyết bài toán đến Mỹ còn chưa thể khắc phục

Thứ 5, 25/12/2025 16:50
Khi Trạm Vũ trụ Quốc tế (ISS) chuẩn bị kết thúc sứ mệnh, Nga tiếp tục hướng tầm nhìn lên không gian với một ý tưởng khác thường: một cấu trúc vũ trụ khổng lồ có khả năng quay tròn.
     
Nổi bật trong ngày

Đi Porsche, cưỡi Ferrari nhưng 'quên' nộp thuế: Hàng nghìn đại gia muối mặt vì bị cảnh sát thu giữ xe

Thứ 4, 24/12/2025 08:11
Chiến dịch Ops Luxury vừa khiến giới nhà giàu "muối mặt" khi phanh phui hàng loạt xế khủng chạy lậu, buộc những cỗ máy triệu đô phải nằm bãi vì coi thường pháp luật.

Truy nã Giám đốc Công ty CP tập đoàn Hoa Hồng Nguyễn Thành Trung

Thứ 4, 24/12/2025 10:27
Năm 2022, Nguyễn Thành Trung là Giám đốc Công ty CP tập đoàn Hoa Hồng đã nhận số tiền hơn 7 tỷ đồng dưới hình thức kí kết hợp đồng vay vốn.

Loạt xe chỉ dành cho đại gia Việt ra mắt năm 2025: Đủ siêu xe đến siêu sang, nhiễu mẫu hàng hiếm trên thế giới, có mẫu giá ngang 2 căn penthouse

Thứ 4, 24/12/2025 11:17
Rolls-Royce Cullian, Rolls-Royce Ghost, Maserati GranCabrio Folgore, McLaren 750S, Ferrari 296 GTS F1-75, Mercedes-benz Maybach GLS 600, Mercedes-AMG SL 63 S E Performance là những mẫu siêu xe và siêu sang ra mắt Việt Nam năm 2025.

Giải Đông Nam Á: Tuyển Việt Nam thi đấu kiên cường, "gieo sầu" cho Indonesia vào đúng phút cuối

Thứ 4, 24/12/2025 14:16
Tuyển Việt Nam đã có trận ra quân giải Đông Nam Á.

Area One chính thức khai trương tổ hợp giải trí "all in one" quy mô lớn bậc nhất phía đông Hà Nội

Thứ 4, 24/12/2025 15:45
Trong bối cảnh nhu cầu vui chơi – vận động – thư giãn cho gia đình ngày càng gia tăng, sự ra đời của Area ONE tại Long Biên được xem là dấu mốc đáng chú ý, mang đến mô hình tổ hợp giải trí trong nhà "tất cả trong một", nơi trẻ em và phụ huynh cùng tận hưởng trọn vẹn một điểm đến.
xe.nguoiduatin.vn