DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6

DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6

Thứ 6, 24/04/2026 16:11
Với sự ra mắt của DeepSeek V4, các công cụ AI đang chứng kiến mức giảm giá mạnh mẽ trong khi hiệu năng và khả năng xử lý vẫn được cải thiện đáng kể.

DeepSeek chính thức phát hành và mở mã nguồn phiên bản xem trước của dòng model mới DeepSeek V4 vào ngày 24 tháng 4, gồm hai phiên bản Pro và Flash. Đây là động thái đáng chú ý khi diễn ra chỉ một ngày sau khi OpenAI ra mắt GPT-5.5, nhưng hai sản phẩm có chiến lược định giá hoàn toàn trái ngược nhau.

Trong khi GPT-5.5 được bán với giá 30 USD mỗi triệu token đầu ra, trong khi DeepSeek V4 được phát hành theo giấy phép MIT hoàn toàn miễn phí, cho phép nhà phát triển tải xuống, chạy cục bộ và chỉnh sửa mã nguồn.

Về mặt định giá dịch vụ API, DeepSeek V4-Pro có giá 3,48 USD mỗi triệu token đầu ra, chỉ bằng khoảng 1/8 so với GPT-5.5. Một nhà phát triển tên Enrico nhận xét rằng DeepSeek V4 "thực sự ấn tượng, nhanh và thông minh", tuy nhiên ông cho rằng mức giá 3,48 USD vẫn "không rẻ" nhưng tin rằng LocalAI sẽ giúp phổ biến model này đến nhiều người dùng hơn.

17770049939882953063809 17770049939401711871484
Chi phí API của DeepSeek V4 chỉ 3,48 USD cho 1 triệu token, rẻ bằng 1/8 GPT-5.5 của OpenAI 

Sự chênh lệch giá khổng lồ này buộc mọi công ty sản phẩm AI phải đánh giá lại cấu trúc lợi nhuận của mình, khi ngưỡng chi phí cho trí thông minh AI vừa bị sụp đổ.

Về hiệu năng, DeepSeek định vị V4-Pro là phiên bản hàng đầu với khả năng cạnh tranh với các model thương mại đóng nguồn tốt nhất. Trong đánh giá toán học, khoa học kỹ thuật và lập trình thi đấu, V4-Pro tuyên bố vượt qua tất cả các model mã nguồn mở hiện có.

Về kiến thức toàn cầu, V4-Pro vượt xa các model mã nguồn mở khác, chỉ thua nhẹ so với Gemini Pro 3.1 của Google. Điểm đáng chú ý là khả năng Agent của V4-Pro đã được cải thiện rõ rệt so với thế hệ trước, đạt mức cao nhất trong các model mã nguồn mở hiện nay.

17770049939827672976853 17770049939814656877970
Thông số hiệu năng ngang ngửa với các mô hình AI hàng đầu thế giới hiện nay

Thông tin nội bộ từ DeepSeek tiết lộ rằng V4 đã trở thành model lập trình AI được nhân viên công ty sử dụng trong công việc hàng ngày. Theo phản hồi từ người dùng nội bộ, trải nghiệm của V4 vượt qua Claude Sonnet 4.5, với chất lượng đầu ra gần bằng Opus 4.6 ở chế độ không suy luận sâu.

Tuy nhiên, ở chế độ suy luận sâu, V4 vẫn thua Opus 4.6. Đây là tín hiệu quan trọng cho thấy khoảng cách công nghệ giữa DeepSeek và các gã khổng lồ phương Tây đang thu hẹp nhanh chóng, mặc dù vẫn chưa hoàn toàn bằng nhau ở các tác vụ phức tạp nhất.

Phiên bản V4-Flash được định vị là lựa chọn nhẹ hơn, nhanh hơn và tiết kiệm chi phí hơn. So với V4-Pro, Flash có hiệu năng thấp hơn một chút về kiến thức toàn cầu nhưng khả năng suy luận tương đương. Nhờ quy mô tham số và kích hoạt nhỏ hơn, dịch vụ API của Flash có ưu thế rõ rệt về tốc độ và chi phí.

Trong đánh giá về Agent, V4-Flash hoạt động ngang ngửa V4-Pro ở các tác vụ đơn giản nhưng có khoảng cách ở các tác vụ khó. Điều này khiến V4-Flash phù hợp hơn cho các kịch bản ứng dụng doanh nghiệp nhạy cảm về độ trễ và chi phí, với độ phức tạp nhiệm vụ ở mức trung bình.

17770049940347633206480 17770049940339540628240
Hiệu năng Agent của DeepSeek V4 

Về mặt kỹ thuật, DeepSeek V4 giới thiệu một cơ chế attention hoàn toàn mới ở tầng kiến trúc nền tảng. Công ty thực hiện nén trên chiều token, kết hợp với công nghệ attention thưa riêng có tên DSA (DeepSeek Sparse Attention), cho phép đạt được khả năng xử lý ngữ cảnh dài hàng đầu thế giới trong khi giảm đáng kể yêu cầu về tài nguyên tính toán và bộ nhớ GPU so với phương pháp truyền thống.

Kết quả trực tiếp của cải tiến kiến trúc này là cửa sổ ngữ cảnh 1 triệu token sẽ trở thành tiêu chuẩn trên tất cả dịch vụ chính thức của DeepSeek. Đối với người dùng doanh nghiệp cần xử lý tài liệu dài, hội thoại kéo dài hoặc các tác vụ nhiều bước phức tạp, việc phổ biến khả năng này có ý nghĩa thực tiễn đáng kể.

17770049939477126481884 17770049939475474908510
Cả 2 phiên bản DeepSeek V4 pro và flash đều hỗ trợ cửa sổ ngữ cảnh 1 triệu token

DeepSeek cho biết dòng V4 đã trải qua quá trình thích ứng và tối ưu hóa chuyên biệt cho các sản phẩm Agent chính thống như Claude Code, OpenClaw, OpenCode và CodeBuddy, mang lại cải thiện hiệu năng trong các tác vụ liên quan đến code và tạo tài liệu.

Ở cấp độ API, cả hai model đều có độ dài ngữ cảnh tối đa 1 triệu token, hỗ trợ cả chế độ không suy luận và chế độ suy luận sâu. DeepSeek khuyến nghị bật chế độ suy luận sâu và đặt cường độ ở mức tối đa cho các kịch bản Agent phức tạp.

Một câu hỏi lớn xung quanh việc phát hành DeepSeek V4 là chip nào được sử dụng để huấn luyện. Huawei xác nhận vào hôm thứ Sáu rằng cụm tính toán AI mới nhất của họ, chạy trên bộ xử lý AI Ascend, có thể hỗ trợ model V4 của DeepSeek. Tuy nhiên, vẫn chưa rõ chip của Huawei được sử dụng rộng rãi đến mức nào trong quá trình huấn luyện so với chip của NVIDIA.

DeepSeek cũng tiết lộ rằng do bị hạn chế về nguồn cung sức mạnh tính toán cao cấp, thông lượng hiện tại của phiên bản Pro rất hạn chế, nhưng dự kiến giá của phiên bản Pro sẽ giảm đáng kể vào nửa cuối năm sau khi Huawei Ascend 950 được tung ra thị trường hàng loạt.

Nguyễn Hải

Cùng chuyên mục

Thi hành lệnh bắt tạm giam chủ hụi Nguyễn Thúy Triều SN 1989

Thứ 6, 24/04/2026 17:22
Nguyễn Thúy Triều bị cáo buộc đã chiếm đoạt hàng tỷ đồng của các hụi viên bằng thủ đoạn tinh vi.

5 thập niên chờ đợi cho một cú “lật kèo”: Thương hiệu đồng hồ đình đám tung loạt siêu phẩm khiến giới sưu tầm ngỡ ngàng

Thứ 6, 24/04/2026 17:19
Tại sự kiện Watches & Wonders 2026, Jaeger-LeCoultre chính thức giới thiệu dòng đồng hồ Master Control Chronomètre, đánh dấu bước chuyển mình quan trọng trong phân khúc đồng hồ thể thao dây liền vỏ, vốn chưa thực sự được hãng tập trung đầu tư kể từ thập niên 70.

Làn da nâu gây sốt thời gian gần đây của Miu Lê

Thứ 6, 24/04/2026 17:18
Trong lần xuất hiện tại thảm đỏ ra mắt phim Đại tiệc trăng máu 8, Miu Lê tiếp tục xuất hiện với làn da nâu bóng khoẻ.

Lần đầu tiên, UAV Ukraine phóng tên lửa đánh chặn, tiêu diệt máy bay không người lái Shahed của Nga

Thứ 6, 24/04/2026 17:17
Ukraine được cho là đã triển khai một hệ thống phòng thủ mới mạnh mẽ chống lại máy bay không người lái Shahed của Nga.

Đây chính là thủ khoa đầu vào Học viện Hý kịch Thượng Hải 2026!

Thứ 6, 24/04/2026 17:11
Nam sinh sở hữu gương mặt góc cạnh, đường nét rõ ràng cùng đôi mắt dài mang đậm chất điện ảnh.
     
Nổi bật trong ngày

BMW 7 Series 2027 đổi mới toàn diện: Thiết kế đỡ ‘dị’, nội thất tràn ngập màn hình đấu Mercedes-Benz S-Class

Thứ 5, 23/04/2026 06:30
BMW 7 Series 2027 facelift cho thấy bước chuyển rõ rệt của BMW khi tập trung mạnh vào công nghệ và điện hóa, thay vì chỉ nâng cấp nhẹ về thiết kế.

Bé gái 2 tuổi bị ô tô cán tử vong khi nằm chơi tại cây xăng ở TP.HCM: Tài xế nói gì?

Thứ 5, 23/04/2026 09:33
Cây xăng sau đó cũng tạm dừng hoạt động để công an tổ chức khám nghiệm hiện trường.

Bác sĩ nói gì về trào lưu uống 1kg chanh mỗi ngày để "chữa ung thư"?

Thứ 5, 23/04/2026 11:00
Những ngày qua, cộng đồng mạng lan truyền câu chuyện về một bệnh nhân ung thư 42 tuổi bỏ điều trị, về nhà uống 1kg chanh mỗi ngày để "giải độc".

Bắt Nguyễn Diệu Hiền SN 1996 cùng hàng chục người khác

Thứ 5, 23/04/2026 11:59
Sau vụ hỗn chiến có sử dụng hung khí xảy ra trên địa bàn xã Phước An, tỉnh Đồng Nai, cảnh sát đã lần lượt truy bắt 11 đối tượng liên quan.

Sốc nặng với hình ảnh khán giả đập TV vì Bóng Ma Hạnh Phúc, cả nước lại đồng loạt gọi tên 1 người

Thứ 5, 23/04/2026 13:56
Bóng Ma Hạnh Phúc tiếp tục viral theo cách lạ lùng chưa từng thấy.  
xe.nguoiduatin.vn