DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6

DeepSeek chính thức phát hành và mở mã nguồn phiên bản xem trước của dòng model mới DeepSeek V4 vào ngày 24 tháng 4, gồm hai phiên bản Pro và Flash. Đây là động thái đáng chú ý khi diễn ra chỉ một ngày sau khi OpenAI ra mắt GPT-5.5, nhưng hai sản phẩm có chiến lược định giá hoàn toàn trái ngược nhau.

Trong khi GPT-5.5 được bán với giá 30 USD mỗi triệu token đầu ra, trong khi DeepSeek V4 được phát hành theo giấy phép MIT hoàn toàn miễn phí, cho phép nhà phát triển tải xuống, chạy cục bộ và chỉnh sửa mã nguồn.

Về mặt định giá dịch vụ API, DeepSeek V4-Pro có giá 3,48 USD mỗi triệu token đầu ra, chỉ bằng khoảng 1/8 so với GPT-5.5. Một nhà phát triển tên Enrico nhận xét rằng DeepSeek V4 "thực sự ấn tượng, nhanh và thông minh", tuy nhiên ông cho rằng mức giá 3,48 USD vẫn "không rẻ" nhưng tin rằng LocalAI sẽ giúp phổ biến model này đến nhiều người dùng hơn.

17770049939882953063809 17770049939401711871484 — Chi phí API của DeepSeek V4 chỉ 3,48 USD cho 1 triệu token, rẻ bằng 1/8 GPT-5.5 của OpenAI

Sự chênh lệch giá khổng lồ này buộc mọi công ty sản phẩm AI phải đánh giá lại cấu trúc lợi nhuận của mình, khi ngưỡng chi phí cho trí thông minh AI vừa bị sụp đổ.

Về hiệu năng, DeepSeek định vị V4-Pro là phiên bản hàng đầu với khả năng cạnh tranh với các model thương mại đóng nguồn tốt nhất. Trong đánh giá toán học, khoa học kỹ thuật và lập trình thi đấu, V4-Pro tuyên bố vượt qua tất cả các model mã nguồn mở hiện có.

Về kiến thức toàn cầu, V4-Pro vượt xa các model mã nguồn mở khác, chỉ thua nhẹ so với Gemini Pro 3.1 của Google. Điểm đáng chú ý là khả năng Agent của V4-Pro đã được cải thiện rõ rệt so với thế hệ trước, đạt mức cao nhất trong các model mã nguồn mở hiện nay.

17770049939827672976853 17770049939814656877970 — Thông số hiệu năng ngang ngửa với các mô hình AI hàng đầu thế giới hiện nay

Thông tin nội bộ từ DeepSeek tiết lộ rằng V4 đã trở thành model lập trình AI được nhân viên công ty sử dụng trong công việc hàng ngày. Theo phản hồi từ người dùng nội bộ, trải nghiệm của V4 vượt qua Claude Sonnet 4.5, với chất lượng đầu ra gần bằng Opus 4.6 ở chế độ không suy luận sâu.

Tuy nhiên, ở chế độ suy luận sâu, V4 vẫn thua Opus 4.6. Đây là tín hiệu quan trọng cho thấy khoảng cách công nghệ giữa DeepSeek và các gã khổng lồ phương Tây đang thu hẹp nhanh chóng, mặc dù vẫn chưa hoàn toàn bằng nhau ở các tác vụ phức tạp nhất.

Phiên bản V4-Flash được định vị là lựa chọn nhẹ hơn, nhanh hơn và tiết kiệm chi phí hơn. So với V4-Pro, Flash có hiệu năng thấp hơn một chút về kiến thức toàn cầu nhưng khả năng suy luận tương đương. Nhờ quy mô tham số và kích hoạt nhỏ hơn, dịch vụ API của Flash có ưu thế rõ rệt về tốc độ và chi phí.

Trong đánh giá về Agent, V4-Flash hoạt động ngang ngửa V4-Pro ở các tác vụ đơn giản nhưng có khoảng cách ở các tác vụ khó. Điều này khiến V4-Flash phù hợp hơn cho các kịch bản ứng dụng doanh nghiệp nhạy cảm về độ trễ và chi phí, với độ phức tạp nhiệm vụ ở mức trung bình.

17770049940347633206480 17770049940339540628240 — Hiệu năng Agent của DeepSeek V4

Về mặt kỹ thuật, DeepSeek V4 giới thiệu một cơ chế attention hoàn toàn mới ở tầng kiến trúc nền tảng. Công ty thực hiện nén trên chiều token, kết hợp với công nghệ attention thưa riêng có tên DSA (DeepSeek Sparse Attention), cho phép đạt được khả năng xử lý ngữ cảnh dài hàng đầu thế giới trong khi giảm đáng kể yêu cầu về tài nguyên tính toán và bộ nhớ GPU so với phương pháp truyền thống.

Kết quả trực tiếp của cải tiến kiến trúc này là cửa sổ ngữ cảnh 1 triệu token sẽ trở thành tiêu chuẩn trên tất cả dịch vụ chính thức của DeepSeek. Đối với người dùng doanh nghiệp cần xử lý tài liệu dài, hội thoại kéo dài hoặc các tác vụ nhiều bước phức tạp, việc phổ biến khả năng này có ý nghĩa thực tiễn đáng kể.

17770049939477126481884 17770049939475474908510 — Cả 2 phiên bản DeepSeek V4 pro và flash đều hỗ trợ cửa sổ ngữ cảnh 1 triệu token

DeepSeek cho biết dòng V4 đã trải qua quá trình thích ứng và tối ưu hóa chuyên biệt cho các sản phẩm Agent chính thống như Claude Code, OpenClaw, OpenCode và CodeBuddy, mang lại cải thiện hiệu năng trong các tác vụ liên quan đến code và tạo tài liệu.

Ở cấp độ API, cả hai model đều có độ dài ngữ cảnh tối đa 1 triệu token, hỗ trợ cả chế độ không suy luận và chế độ suy luận sâu. DeepSeek khuyến nghị bật chế độ suy luận sâu và đặt cường độ ở mức tối đa cho các kịch bản Agent phức tạp.

Một câu hỏi lớn xung quanh việc phát hành DeepSeek V4 là chip nào được sử dụng để huấn luyện. Huawei xác nhận vào hôm thứ Sáu rằng cụm tính toán AI mới nhất của họ, chạy trên bộ xử lý AI Ascend, có thể hỗ trợ model V4 của DeepSeek. Tuy nhiên, vẫn chưa rõ chip của Huawei được sử dụng rộng rãi đến mức nào trong quá trình huấn luyện so với chip của NVIDIA.

DeepSeek cũng tiết lộ rằng do bị hạn chế về nguồn cung sức mạnh tính toán cao cấp, thông lượng hiện tại của phiên bản Pro rất hạn chế, nhưng dự kiến giá của phiên bản Pro sẽ giảm đáng kể vào nửa cuối năm sau khi Huawei Ascend 950 được tung ra thị trường hàng loạt.

Nguyễn Hải

DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6

Thi hành lệnh bắt tạm giam chủ hụi Nguyễn Thúy Triều SN 1989

5 thập niên chờ đợi cho một cú “lật kèo”: Thương hiệu đồng hồ đình đám tung loạt siêu phẩm khiến giới sưu tầm ngỡ ngàng

Làn da nâu gây sốt thời gian gần đây của Miu Lê

Lần đầu tiên, UAV Ukraine phóng tên lửa đánh chặn, tiêu diệt máy bay không người lái Shahed của Nga

Đây chính là thủ khoa đầu vào Học viện Hý kịch Thượng Hải 2026!

BMW 7 Series 2027 đổi mới toàn diện: Thiết kế đỡ ‘dị’, nội thất tràn ngập màn hình đấu Mercedes-Benz S-Class

Bé gái 2 tuổi bị ô tô cán tử vong khi nằm chơi tại cây xăng ở TP.HCM: Tài xế nói gì?

Bác sĩ nói gì về trào lưu uống 1kg chanh mỗi ngày để "chữa ung thư"?

Bắt Nguyễn Diệu Hiền SN 1996 cùng hàng chục người khác

Sốc nặng với hình ảnh khán giả đập TV vì Bóng Ma Hạnh Phúc, cả nước lại đồng loạt gọi tên 1 người

Tin đọc nhiều

Tiểu thư Harper nhà Beckham thất thần mỏi mệt, xuống sắc thấy rõ khi để mặt mộc, bước ra từ xế hộp sang chảnh

3 quy định mới nhất về đăng ký thường trú, tạm trú, tất cả người dân cần nắm rõ

Lời khuyên dành cho những người đi du lịch bằng tàu hỏa

"Huyền thoại" Bạch Hổ lớn nhất Việt Nam khiến thế giới ngỡ ngàng: Niềm tin vững chắc với Liên Xô!

Moon Geun Young trượt chân ngã đi khám ra bệnh quái ác: Bị chẩn đoán sai, trốn trong hầm gửi xe khóc nức nở 1 mình

Báo giá quảng cáo