Không cần đến AI Trung Quốc, các nhà khoa học Mỹ cũng tạo ra được đối thủ của OpenAI o1 với giá siêu rẻ

Không cần đến AI Trung Quốc, các nhà khoa học Mỹ cũng tạo ra được đối thủ của OpenAI o1 với giá siêu rẻ

Thứ 6, 07/02/2025 19:51
Dù chỉ tiêu tốn khoảng 50 USD chi phí huấn luyện mô hình, mô hình AI mới cũng có khả năng suy luận tương tự OpenAI o1 và DeepSeek R1.

Hóa ra không chỉ các nhà nghiên cứu Trung Quốc mới biết cách tạo nên các mô hình AI chất lượng cao với giá rẻ, một nhóm các nhà khoa học từ Đại học Stanford và Đại học Washington đã tạo nên một bước đột phá ấn tượng.

Họ đã phát triển một mô hình “lý luận” AI, được đặt tên là s1, với chi phí sử dụng điện toán đám mây chưa đến 50 USD – một con số khiêm tốn so với hàng triệu đô la thường cần để huấn luyện các mô hình hàng đầu hiện nay.

Theo bài báo khoa học được công bố vào thứ Sáu tuần trước, mô hình s1 cho thấy hiệu năng tương đương với các mô hình tiên tiến như o1 của OpenAI và R1 của DeepSeek trong các bài kiểm tra về khả năng tính toán và lập trình. Đáng chú ý, nhóm nghiên cứu đã mở mã nguồn của s1 trên GitHub, kèm theo dữ liệu và mã lập trình được sử dụng trong quá trình huấn luyện, nhằm khuyến khích sự đổi mới và hợp tác trong cộng đồng AI.

openai o1 1
Dù có giá rẻ, mô hình AI mới cũng có khả năng lập luận như o1 của OpenAI

Thay vì huấn luyện một mô hình “lý luận” từ đầu – một quá trình tốn kém về tài nguyên và kinh phí – các nhà nghiên cứu đã lựa chọn một cách tiếp cận tinh tế hơn. Họ bắt đầu với một mô hình ngôn ngữ có sẵn từ phòng thí nghiệm AI của Trung Quốc thuộc sở hữu của Alibaba, sau đó “tinh chỉnh” mô hình đó thông qua kỹ thuật chưng cất (distillation).

Quá trình này cho phép trích xuất các khả năng “lý luận” từ một mô hình AI khác bằng cách huấn luyện mô hình ban đầu theo các câu trả lời và quy trình “suy nghĩ” của mô hình nguồn. Cụ thể, s1 được chưng cất từ một trong những mô hình lý luận của Google – Gemini 2.0 Flash Thinking Experimental – mà Google cung cấp miễn phí trên nền tảng Google AI Studio (mặc dù với một số giới hạn hàng ngày).

Nhóm nghiên cứu đã thu thập một tập dữ liệu gồm 1.000 câu hỏi được chọn lọc kỹ lưỡng, kết hợp với các câu trả lời và quy trình “suy nghĩ” đằng sau mỗi câu trả lời từ mô hình của Google. Nhờ đó, họ sử dụng phương pháp huấn luyện theo hướng giám sát (supervised fine-tuning – SFT) để dạy cho mô hình cách suy luận một cách có hệ thống. So với phương pháp học tăng cường quy mô lớn mà DeepSeek áp dụng để huấn luyện đối thủ cạnh tranh của OpenAI, phương pháp SFT giúp giảm đáng kể chi phí cũng như thời gian huấn luyện.

artificial intelligence
Sử dụng kỹ thuật "chưng cất" kiến thức, mô hình AI mới dù có giá rẻ hơn nhưng cũng có nhiều tính năng tương đương của OpenAI

Quá trình huấn luyện mô hình s1 diễn ra nhanh chóng chỉ trong chưa đầy 30 phút, sử dụng 16 GPU NVIDIA H100 – mỗi chiếc GPU có giá thuê khoảng 25.000 USD nhưng thông qua dịch vụ điện toán đám mây, tổng chi phí thuê chỉ dưới 50 USD. Một thủ thuật thú vị khác mà các nhà nghiên cứu áp dụng là cho mô hình “chờ” (wait) trong quá trình suy luận, giúp s1 kiểm tra lại công việc của mình và kéo dài thời gian “suy nghĩ” để cho ra các câu trả lời chính xác hơn.

Mặc dù những kết quả đạt được của s1 đã mở ra nhiều cơ hội đổi mới trong không gian AI, nhưng đồng thời cũng đặt ra câu hỏi về quá trình “phân hóa” (commoditization) các mô hình AI. Khi mà một nhóm các nhà nghiên cứu với nguồn lực hạn chế có thể tái tạo lại những khả năng của một mô hình trị giá hàng triệu đô la chỉ với một khoản “túi tiền” khiêm tốn, thì ranh giới giữa đổi mới và việc “sao chép” dường như trở nên mỏng manh. Điều này không làm hài lòng các phòng thí nghiệm AI lớn; OpenAI chẳng hạn đã cáo buộc DeepSeek sử dụng dữ liệu từ API của mình không đúng cách nhằm mục đích chưng cất mô hình.

Trong khi đó, các ông lớn như Meta, Google và Microsoft dự kiến sẽ đầu tư hàng trăm tỷ đô la trong năm 2025 cho cơ sở hạ tầng AI, với một phần nguồn lực dành cho việc huấn luyện các mô hình thế hệ tiếp theo. Tuy nhiên, thành tựu của mô hình s1 cho thấy rằng, đối với một số ứng dụng nhất định, việc áp dụng các kỹ thuật như chưng cất và huấn luyện giám sát có thể mang lại những kết quả ấn tượng với chi phí tương đối thấp.

Dù phương pháp này cho phép “tái tạo” các khả năng của một mô hình hiện có một cách tiết kiệm, nó cũng chỉ chứng minh được khả năng nhân rộng các chức năng hiện tại chứ không tạo ra những bước đột phá vượt trội so với những gì đã có.

Nguyễn Hải

Cùng chuyên mục

Saigon Phantom đăng quang Nữ Vương Đại Chiến 2026

Chủ nhật, 10/05/2026 18:31
Những cô gái của Saigon Phantom xuất sắc giành được chức vô địch danh giá.

Tứ đại mỹ nhân cũng có ngày này: Diễn văn nghệ đám cưới hết mình, netizen cười hết hồn

Chủ nhật, 10/05/2026 17:53
Tứ đại mỹ nhân khiến mạng xã hội rần rần vì một đoạn clip đi hát đám cưới.

Để con ở nhà một mình, bố mẹ bàng hoàng phát hiện bé 4 tuổi ngã từ tầng 11

Chủ nhật, 10/05/2026 17:23
Bị để ở nhà một mình khi bố mẹ đi giao hàng, bé trai 4 tuổi đã tự mở cửa sổ để ngóng bố mẹ và không may rơi từ tầng 11.

Giáo sư Toán học Việt vừa được bầu vào Viện Hàn lâm Châu Âu: Là viện sĩ của 6 viện hàn lâm danh tiếng thế giới, tốt nghiệp tiến sĩ năm 27 tuổi

Chủ nhật, 10/05/2026 17:23
GS.TSKH Hoàng Xuân Phú - nhà toán học quê Nghệ An vừa trở thành thành viên Viện Hàn lâm Châu Âu, nâng tổng số viện hàn lâm khoa học quốc tế mà ông là viện sĩ lên 6 tổ chức danh tiếng.

Những người mẹ quyền lực của giới siêu giàu Việt: Kinh doanh thành công, con cái cũng toàn gương mặt nổi tiếng

Chủ nhật, 10/05/2026 17:23
Không chỉ được biết đến là mẹ của các “thiếu gia”, “ái nữ” nổi tiếng, nhiều nữ doanh nhân Việt còn sở hữu sự nghiệp kinh doanh đồ sộ, đứng sau những tập đoàn và thương hiệu có sức ảnh hưởng lớn trên thị trường.
     
Nổi bật trong ngày

Thông báo nóng về sức khoẻ Trang Pháp

Thứ 7, 09/05/2026 10:30
Công ty quản lý của Trang Pháp vừa đưa ra thông báo về tình hình hiện tại của cô tại Trung Quốc.

Đá hỏng penalty, tuyển Indonesia dễ bị loại sớm sau thất bại nghiệt ngã

Chủ nhật, 10/05/2026 03:11
Tuyển Indonesia đã để thua đầy tiếc nuối.

HLV Indonesia: “Indonesia sẽ đánh bại Thái Lan; chúng tôi còn muốn dự World Cup”

Chủ nhật, 10/05/2026 15:22
HLV Indonesia vô cùng tự tin dù rơi vào “bảng tử thần” tại VCK Asian Cup 2027.

Làm thế nào mà một công ty bán bồn cầu lại trở thành “ông vua ngầm” trong lĩnh vực lưu trữ bằng trí tuệ nhân tạo?

Thứ 7, 09/05/2026 12:35
Một công ty nổi tiếng với nắp bồn cầu thông minh bất ngờ trở thành ngôi sao mới của làn sóng AI toàn cầu khi mảng linh kiện bán dẫn tăng trưởng bùng nổ, thậm chí kiếm tiền nhiều hơn cả hoạt động vệ sinh truyền thống từng làm nên tên tuổi suốt hơn một thế kỷ.

Thua liền 2 trận, tuyển Trung Quốc đối mặt với cái kết buồn tại giải châu Á

Chủ nhật, 10/05/2026 03:11
Tuyển Trung Quốc rơi vào tình thế ngặt nghèo.
xe.nguoiduatin.vn