Không cần đến AI Trung Quốc, các nhà khoa học Mỹ cũng tạo ra được đối thủ của OpenAI o1 với giá siêu rẻ

Không cần đến AI Trung Quốc, các nhà khoa học Mỹ cũng tạo ra được đối thủ của OpenAI o1 với giá siêu rẻ

Thứ 6, 07/02/2025 19:51
Dù chỉ tiêu tốn khoảng 50 USD chi phí huấn luyện mô hình, mô hình AI mới cũng có khả năng suy luận tương tự OpenAI o1 và DeepSeek R1.

Hóa ra không chỉ các nhà nghiên cứu Trung Quốc mới biết cách tạo nên các mô hình AI chất lượng cao với giá rẻ, một nhóm các nhà khoa học từ Đại học Stanford và Đại học Washington đã tạo nên một bước đột phá ấn tượng.

Họ đã phát triển một mô hình “lý luận” AI, được đặt tên là s1, với chi phí sử dụng điện toán đám mây chưa đến 50 USD – một con số khiêm tốn so với hàng triệu đô la thường cần để huấn luyện các mô hình hàng đầu hiện nay.

Theo bài báo khoa học được công bố vào thứ Sáu tuần trước, mô hình s1 cho thấy hiệu năng tương đương với các mô hình tiên tiến như o1 của OpenAI và R1 của DeepSeek trong các bài kiểm tra về khả năng tính toán và lập trình. Đáng chú ý, nhóm nghiên cứu đã mở mã nguồn của s1 trên GitHub, kèm theo dữ liệu và mã lập trình được sử dụng trong quá trình huấn luyện, nhằm khuyến khích sự đổi mới và hợp tác trong cộng đồng AI.

openai o1 1
Dù có giá rẻ, mô hình AI mới cũng có khả năng lập luận như o1 của OpenAI

Thay vì huấn luyện một mô hình “lý luận” từ đầu – một quá trình tốn kém về tài nguyên và kinh phí – các nhà nghiên cứu đã lựa chọn một cách tiếp cận tinh tế hơn. Họ bắt đầu với một mô hình ngôn ngữ có sẵn từ phòng thí nghiệm AI của Trung Quốc thuộc sở hữu của Alibaba, sau đó “tinh chỉnh” mô hình đó thông qua kỹ thuật chưng cất (distillation).

Quá trình này cho phép trích xuất các khả năng “lý luận” từ một mô hình AI khác bằng cách huấn luyện mô hình ban đầu theo các câu trả lời và quy trình “suy nghĩ” của mô hình nguồn. Cụ thể, s1 được chưng cất từ một trong những mô hình lý luận của Google – Gemini 2.0 Flash Thinking Experimental – mà Google cung cấp miễn phí trên nền tảng Google AI Studio (mặc dù với một số giới hạn hàng ngày).

Nhóm nghiên cứu đã thu thập một tập dữ liệu gồm 1.000 câu hỏi được chọn lọc kỹ lưỡng, kết hợp với các câu trả lời và quy trình “suy nghĩ” đằng sau mỗi câu trả lời từ mô hình của Google. Nhờ đó, họ sử dụng phương pháp huấn luyện theo hướng giám sát (supervised fine-tuning – SFT) để dạy cho mô hình cách suy luận một cách có hệ thống. So với phương pháp học tăng cường quy mô lớn mà DeepSeek áp dụng để huấn luyện đối thủ cạnh tranh của OpenAI, phương pháp SFT giúp giảm đáng kể chi phí cũng như thời gian huấn luyện.

artificial intelligence
Sử dụng kỹ thuật "chưng cất" kiến thức, mô hình AI mới dù có giá rẻ hơn nhưng cũng có nhiều tính năng tương đương của OpenAI

Quá trình huấn luyện mô hình s1 diễn ra nhanh chóng chỉ trong chưa đầy 30 phút, sử dụng 16 GPU NVIDIA H100 – mỗi chiếc GPU có giá thuê khoảng 25.000 USD nhưng thông qua dịch vụ điện toán đám mây, tổng chi phí thuê chỉ dưới 50 USD. Một thủ thuật thú vị khác mà các nhà nghiên cứu áp dụng là cho mô hình “chờ” (wait) trong quá trình suy luận, giúp s1 kiểm tra lại công việc của mình và kéo dài thời gian “suy nghĩ” để cho ra các câu trả lời chính xác hơn.

Mặc dù những kết quả đạt được của s1 đã mở ra nhiều cơ hội đổi mới trong không gian AI, nhưng đồng thời cũng đặt ra câu hỏi về quá trình “phân hóa” (commoditization) các mô hình AI. Khi mà một nhóm các nhà nghiên cứu với nguồn lực hạn chế có thể tái tạo lại những khả năng của một mô hình trị giá hàng triệu đô la chỉ với một khoản “túi tiền” khiêm tốn, thì ranh giới giữa đổi mới và việc “sao chép” dường như trở nên mỏng manh. Điều này không làm hài lòng các phòng thí nghiệm AI lớn; OpenAI chẳng hạn đã cáo buộc DeepSeek sử dụng dữ liệu từ API của mình không đúng cách nhằm mục đích chưng cất mô hình.

Trong khi đó, các ông lớn như Meta, Google và Microsoft dự kiến sẽ đầu tư hàng trăm tỷ đô la trong năm 2025 cho cơ sở hạ tầng AI, với một phần nguồn lực dành cho việc huấn luyện các mô hình thế hệ tiếp theo. Tuy nhiên, thành tựu của mô hình s1 cho thấy rằng, đối với một số ứng dụng nhất định, việc áp dụng các kỹ thuật như chưng cất và huấn luyện giám sát có thể mang lại những kết quả ấn tượng với chi phí tương đối thấp.

Dù phương pháp này cho phép “tái tạo” các khả năng của một mô hình hiện có một cách tiết kiệm, nó cũng chỉ chứng minh được khả năng nhân rộng các chức năng hiện tại chứ không tạo ra những bước đột phá vượt trội so với những gì đã có.

Nguyễn Hải

Cùng chuyên mục

Sàn tiền số gửi nhầm 44 tỷ USD bitcoin cho người dùng, 695 khách hàng nhận thông báo bất ngờ

Thứ 2, 09/02/2026 09:18
Sàn giao dịch tiền điện tử Bithumb của Hàn Quốc mới đây đã vô tình phân phát hơn 40 tỷ USD bitcoin cho khách hàng, theo hãng tin Reuters.

Phát hiện doanh nghiệp kinh doanh vàng bạc, đá quý cố tình "lách thuế", che giấu doanh thu hơn 1.500 tỷ đồng

Thứ 2, 09/02/2026 09:18
Đối tượng Nguyễn Đức Dương đã chỉ đạo nhân viên không xuất hóa đơn giá trị gia tăng khi bán vàng, bạc; đồng thời yêu cầu nhận tiền mặt hoặc chuyển khoản nhưng không vào tài khoản công ty nhằm trốn thuế.

VinFast ‘chơi lớn có điều kiện’: Miễn phí sạc pin ô tô đến đầu năm 2029, xe máy điện miễn phí đổi pin đến hết tháng 6/2028

Thứ 2, 09/02/2026 07:43
Khách hàng mua ô tô VinFast sẽ được miễn phí sạc pin trong 3 năm, kéo dài đến hết tháng 2/2029.

Hyundai Stargazer 2026 nhận cọc tại đại lý, dễ ra mắt sau Tết: Thiết kế bắt mắt hơn cạnh tranh Xpander, bản cũ dọn kho khuyến mãi gần 100 triệu đồng

Thứ 2, 09/02/2026 06:48
Hyundai Stargazer 2026 hiện được một số đại lý tại Hà Nội nhận đặt cọc sớm, dự kiến giao xe từ tháng 3/2026. Những hình ảnh thực tế tại trung tâm thử nghiệm khí thải và nhà máy cho thấy ngày ra mắt chính thức đang cận kề.

Vỡ trận, tuyển Indonesia thua thảm 0-7 trước Trung Quốc ngay sân nhà

Thứ 2, 09/02/2026 05:20
Tuyển trẻ của Indonesia thua cực đậm khi đá giao hữu với Trung Quốc trước thềm giải châu Á.
     
Nổi bật trong ngày

Ekip thông tim bào thai tự hào chia sẻ tại Gala WeChoice: "Việt Nam là trung tâm thứ 4 trên thế giới làm được việc này"

Chủ nhật, 08/02/2026 02:47
Ekip thông tim bào thai của Bệnh viện Từ Dũ và Bệnh viện Nhi Đồng 1 đã viết nên một chương đầy xúc động về trí tuệ, lòng can đảm và niềm tin vào sự sống tại WeChoice Awards 2025.

Hai anh Tây muốn thử món bún đậu mắm tôm "quốc hồn quốc túy" của người Việt, chịu đói nửa ngày vẫn chưa gọi xong

Chủ nhật, 08/02/2026 22:02
Chỉ với một món ăn quen thuộc như bún đậu mắm tôm, tiếng Việt cũng trở thành "thử thách khó nhằn" với không ít người nước ngoài.

FIFA sắp ra thông báo quan trọng, Indonesia đón tin vui lớn?

Chủ nhật, 08/02/2026 14:47
Chủ tịch LĐBĐ Indonesia khẳng định quốc gia này sẵn sàng đăng cai World Cup nhưng đang chờ thông báo từ phía FIFA.

Tài sản lớn nhất của Ninh Dương Lan Ngọc

Chủ nhật, 08/02/2026 23:08
Đâu mới là tài sản có giá trị cao nhất trong cuộc đời Ninh Dương Lan Ngọc?

Đình Bắc nhận lời khuyên đặc biệt từ phóng viên Trung Quốc trước khả năng xuất ngoại

Chủ nhật, 08/02/2026 15:29
Phóng viên thể thao người Trung Quốc cho rằng Đình Bắc nên chọn CLB Guangxi Hengchen thay vì có thể hy vọng sang Nhật Bản hoặc Hàn Quốc.
xe.nguoiduatin.vn