Không phải 6 triệu USD, DeepSeek cần tiêu tốn ít nhất 500 triệu USD để phát triển mô hình AI

Không phải 6 triệu USD, DeepSeek cần tiêu tốn ít nhất 500 triệu USD để phát triển mô hình AI

Chủ nhật, 02/02/2025 16:44
Thậm chí báo cáo của SemiAnalysis còn cho rằng, chi phí của DeepSeek có thể còn lên tới 1,6 tỷ USD khi phát triển mô hình AI của mình.

DeepSeek, startup AI của Trung Quốc, đã trở thành tâm điểm của giới công nghệ trong tuần này, với sự chú ý đổ dồn vào một con số duy nhất: 6 triệu USD. Trong bài báo về mô hình AI mới nhất của mình, DeepSeek cho biết tổng chi phí huấn luyện chỉ vỏn vẹn 5,576 triệu USD, dựa trên giá thuê các GPU của NVIDIA.

Tuy nhiên, họ cũng đưa ra một điều kiện rõ ràng rằng con số này chỉ bao gồm quá trình "huấn luyện chính thức" của mô hình, không tính đến các chi phí liên quan đến "nghiên cứu trước đó và thử nghiệm loại bỏ về kiến trúc, thuật toán hay dữ liệu".

Đầu tuần này, trợ lý AI của DeepSeek đã soán ngôi vị ứng dụng miễn phí được tải nhiều nhất tại Mỹ trên App Store của Apple, vượt qua ChatGPT của OpenAI. Thị trường chứng khoán công nghệ toàn cầu đã chao đảo, với các nhà sản xuất chip như NVIDIA và Broadcom mất tổng cộng 800 tỷ USD vốn hóa thị trường vào thứ Hai.

1738047877 0145
Chỉ trong một tuần, DeepSeek đã làm giới công nghệ Mỹ chao đảo

Một báo cáo mới từ SemiAnalysis, công ty nghiên cứu và tư vấn về bán dẫn, đã cung cấp thêm các ước tính về chi phí của DeepSeek. Công ty này ước tính rằng chi phí phần cứng của DeepSeek "cao hơn nhiều so với 500 triệu USD tính trong toàn bộ lịch sử công ty", đồng thời nhấn mạnh rằng chi phí R&D và tổng chi phí sở hữu cũng rất đáng kể. Việc tạo ra "dữ liệu tổng hợp" để mô hình huấn luyện sẽ đòi hỏi "một lượng tính toán đáng kể", SemiAnalysis cho biết.

Báo cáo cũng chỉ ra rằng chi phí để huấn luyện mô hình Claude 3.5 Sonnet từ Anthropic lên tới "hàng chục triệu USD", nhưng lưu ý rằng Anthropic đã huy động được hàng tỷ USD từ Amazon và Google, một dấu hiệu cho thấy cần thêm nhiều tiền hơn nữa để vận hành các mô hình và công ty. "Đó là bởi vì họ phải thử nghiệm, đưa ra các kiến trúc mới, thu thập và làm sạch dữ liệu, trả lương nhân viên, và nhiều thứ khác nữa", SemiAnalysis giải thích.

Theo SemiAnalysis, con số này có thể lên tới 1,6 tỷ USD: “Phân tích của chúng tôi cho thấy tổng chi phí vốn máy chủ cho DeepSeek là xấp xỉ 1,6 tỷ USD, với một phần đáng kể lên tới 944 triệu USD liên quan đến việc vận hành các cụm như vậy.”

Chính bài báo của DeepSeek cũng không đưa ra ước tính về chi phí tính toán của họ. Công ty chưa ngay lập tức phản hồi yêu cầu bình luận. "Rõ ràng DeepSeek là duy nhất ở chỗ họ đạt được mức chi phí và năng lực này đầu tiên", SemiAnalysts viết. Công ty này cũng bổ sung rằng R1 của DeepSeek "là một mô hình rất tốt" và việc "bắt kịp được năng lực lập luận nhanh đến vậy là rất ấn tượng".

Các chuyên gia và nhà phân tích trong tuần này đã ca ngợi chất lượng mô hình của DeepSeek, đồng thời chỉ ra điều này ấn tượng như thế nào khi xét đến việc Mỹ đã 3 lần hạn chế xuất khẩu chip sang Trung Quốc trong 3 năm qua. Điều này dẫn đến lo ngại rằng Mỹ đang tụt lại phía sau đối thủ chính của mình trong một thị trường được dự báo sẽ vượt quá 1 nghìn tỷ USD doanh thu trong vòng một thập kỷ tới.

1440x810cmsv20d42e762 e8da 5e16 9d2d 867754ed26e6 9011914

DeepSeek được thành lập năm 2023 bởi Lương Văn Phong, đồng sáng lập quỹ đầu cơ định lượng High-Flyer, tập trung vào AI. Theo các nhà phân tích tại Jefferies, công ty khởi nghiệp AI này được cho là tách ra từ đơn vị nghiên cứu AI của quỹ đầu cơ vào tháng 4/2023 để tập trung vào các mô hình ngôn ngữ lớn và theo đuổi trí tuệ nhân tạo phổ quát (AGI) - một nhánh của AI có khả năng ngang bằng hoặc vượt trội hơn trí tuệ con người trong nhiều tác vụ, mục tiêu mà OpenAI và các công ty khác cũng đang theo đuổi. DeepSeek vẫn hoàn toàn thuộc sở hữu và được tài trợ bởi High-Flyer.

Sự quan tâm xung quanh DeepSeek bắt đầu tăng mạnh từ đầu tháng này, khi công ty khởi nghiệp ra mắt R1, một mô hình suy luận cạnh tranh với o1 của OpenAI. Đây là một mô hình mã nguồn mở, có nghĩa là bất kỳ nhà phát triển AI nào cũng có thể sử dụng. Tương tự như các chatbot Trung Quốc khác, DeepSeek cũng có những hạn chế về một số chủ đề nhất định: Chẳng hạn, khi được hỏi về chính trị, DeepSeek được cho là đã hướng người dùng tránh xa những câu hỏi tương tự.

CEO của OpenAI, Sam Altman, đã công khai khen ngợi mô hình này, nhưng công ty cũng cho biết họ tin rằng có bằng chứng cho thấy DeepSeek đã thu thập dữ liệu của OpenAI một cách không đúng đắn để xây dựng sản phẩm. Tại một sự kiện ở Washington, D.C., vào thứ Năm do OpenAI tổ chức, Altman nói rằng DeepSeek "rõ ràng là một mô hình tuyệt vời". "Đây là lời nhắc nhở về mức độ cạnh tranh và sự cần thiết để AI đại chúng chiến thắng", ông nói. Ông cũng chỉ ra "mức độ quan tâm đến khả năng suy luận, mức độ quan tâm đến mã nguồn mở".

Nguyễn Hải

Cùng chuyên mục

Hãng thông tấn Đức: 'Chưa từng có!' Việt Nam lập kỷ lục chỉ trong một tháng đầu năm 2026

Thứ 4, 18/02/2026 16:00
Trong khi Thái Lan và Campuchia đang gặp khó, hãng thông tấn Đức DPA đã lý giải tại sao du lịch Việt Nam lại bùng nổ.

3 loại cây nên trồng ngay đầu năm Bính Ngọ để hút khí độc, tăng sức khỏe

Thứ 4, 18/02/2026 16:00
Trồng những loại cây này trong năm Bính Ngọ là cách hiệu quả để tăng cường sức khỏe cho cả gia đình.

3 tháng chuẩn bị cướp ngân hàng "như phim hành động" của giang hồ nhiều tiền án Tài “Đen”

Thứ 4, 18/02/2026 15:11
Liên quan đến vụ “Cướp gần 1,9 tỷ đồng ở ngân hàng tại Gia Lai” như đã thông tin, ngày 18/2, Cục Cảnh sát Hình sự (C02), Bộ Công an đã thông tin thêm về vụ việc này.

Vờ bán bông tai rồi "cuỗm" luôn vòng vàng 20 triệu đồng ngay tối 29 Tết, "nữ quái" chưa kịp ăn Tết đã phải “ăn cơm tù”

Thứ 4, 18/02/2026 14:42
Lợi dụng lúc tiệm vàng đang tấp nập khách sắm Tết, Trần Thúy An đã diễn vở kịch đi bán vàng để thừa cơ "thó" mất chiếc vòng tay giá trị rồi tẩu thoát. Thế nhưng, màn "ảo thuật" vụng về này đã bị Công an phường Chánh Hưng lật tẩy thần tốc, bắt giữ đối tượng ngay khi không khí Tết đang rộn ràng khắp phố phường.

Rao Chrysler 300C hơn 500 triệu đồng, người bán cho biết: ‘Đời sâu nhưng rất lực’

Thứ 4, 18/02/2026 14:33
Chiếc Chrysler 300 trong bài viết dù xuất xưởng từ 2008, lăn bánh dự kiến hơn 120.000km nhưng được người bán quảng cáo rằng còn "rất lực".
     
Nổi bật trong ngày

Món ăn “sang” ngày Tết có thể hại thận – xương, gây hỏng tim, tăng nguy cơ ung thư nếu lạm dụng

Thứ 3, 17/02/2026 08:21
Hiện nay, trên mâm cơm ngày Tết, ngoài những món truyền thống, không ít gia đình đu trend cỗ “sang” với nhiều món ăn mới mẻ.

Lamborghini Revuelto đầu tiên tại Việt Nam ra biển: Xe đắt ngang 4 căn chung cư cao cấp nhưng tiền biển 'check var' xong mới bất ngờ

Thứ 3, 17/02/2026 11:18
Chiếc Lamborghini Revuelto đầu tiên tại Việt Nam đã chính thức ra biển số TP.HCM, giá lăn bánh ước gần 50 tỷ đồng.

Nàng dâu bị đuổi khỏi nhà mùng 2 Tết, vừa qua 3 ngày chồng đã gọi về cứu mẹ và cái kết không ai ngờ

Thứ 3, 17/02/2026 17:55
Nhưng khi nàng dâu vội vã lao tới bệnh viện, sự thật phía sau khiến tất cả chết lặng.

Tết về thăm nhà Khuất Văn Khang: "Năm mới ước mơ thi đấu thật tốt để xây nhà báo hiếu bố mẹ"

Thứ 3, 17/02/2026 22:21
Khuất Văn Khang trở về nhà trong sự hãnh diện của gia đình. Cậu bé từng nhịn ăn để xin bố cho đi đá bóng hơn 10 năm trước giờ đã rinh hàng loạt huy chương cao quý ở cấp độ đội tuyển trẻ Việt Nam.

Người phụ nữ 64 tuổi kết hôn với trai trẻ 32, nhan sắc khiến dân mạng chấn động

Thứ 4, 18/02/2026 12:27
Một người phụ nữ Nhật Bản 64 tuổi đang trở thành hiện tượng mạng xã hội sau khi công khai chuyện tình “chị em” với người chồng kém mình 32 tuổi. Nhân vật chính là Kurata Ritsuko, được cư dân mạng ưu ái gọi là “người đẹp không tuổi” nhờ vẻ ngoài trẻ trung, phong thái rạng rỡ ở tuổi ngoài 60.
xe.nguoiduatin.vn