Không cần đến AI Trung Quốc, các nhà khoa học Mỹ cũng tạo ra được đối thủ của OpenAI o1 với giá siêu rẻ

Không cần đến AI Trung Quốc, các nhà khoa học Mỹ cũng tạo ra được đối thủ của OpenAI o1 với giá siêu rẻ

Thứ 6, 07/02/2025 19:51
Dù chỉ tiêu tốn khoảng 50 USD chi phí huấn luyện mô hình, mô hình AI mới cũng có khả năng suy luận tương tự OpenAI o1 và DeepSeek R1.

Hóa ra không chỉ các nhà nghiên cứu Trung Quốc mới biết cách tạo nên các mô hình AI chất lượng cao với giá rẻ, một nhóm các nhà khoa học từ Đại học Stanford và Đại học Washington đã tạo nên một bước đột phá ấn tượng.

Họ đã phát triển một mô hình “lý luận” AI, được đặt tên là s1, với chi phí sử dụng điện toán đám mây chưa đến 50 USD – một con số khiêm tốn so với hàng triệu đô la thường cần để huấn luyện các mô hình hàng đầu hiện nay.

Theo bài báo khoa học được công bố vào thứ Sáu tuần trước, mô hình s1 cho thấy hiệu năng tương đương với các mô hình tiên tiến như o1 của OpenAI và R1 của DeepSeek trong các bài kiểm tra về khả năng tính toán và lập trình. Đáng chú ý, nhóm nghiên cứu đã mở mã nguồn của s1 trên GitHub, kèm theo dữ liệu và mã lập trình được sử dụng trong quá trình huấn luyện, nhằm khuyến khích sự đổi mới và hợp tác trong cộng đồng AI.

openai o1 1
Dù có giá rẻ, mô hình AI mới cũng có khả năng lập luận như o1 của OpenAI

Thay vì huấn luyện một mô hình “lý luận” từ đầu – một quá trình tốn kém về tài nguyên và kinh phí – các nhà nghiên cứu đã lựa chọn một cách tiếp cận tinh tế hơn. Họ bắt đầu với một mô hình ngôn ngữ có sẵn từ phòng thí nghiệm AI của Trung Quốc thuộc sở hữu của Alibaba, sau đó “tinh chỉnh” mô hình đó thông qua kỹ thuật chưng cất (distillation).

Quá trình này cho phép trích xuất các khả năng “lý luận” từ một mô hình AI khác bằng cách huấn luyện mô hình ban đầu theo các câu trả lời và quy trình “suy nghĩ” của mô hình nguồn. Cụ thể, s1 được chưng cất từ một trong những mô hình lý luận của Google – Gemini 2.0 Flash Thinking Experimental – mà Google cung cấp miễn phí trên nền tảng Google AI Studio (mặc dù với một số giới hạn hàng ngày).

Nhóm nghiên cứu đã thu thập một tập dữ liệu gồm 1.000 câu hỏi được chọn lọc kỹ lưỡng, kết hợp với các câu trả lời và quy trình “suy nghĩ” đằng sau mỗi câu trả lời từ mô hình của Google. Nhờ đó, họ sử dụng phương pháp huấn luyện theo hướng giám sát (supervised fine-tuning – SFT) để dạy cho mô hình cách suy luận một cách có hệ thống. So với phương pháp học tăng cường quy mô lớn mà DeepSeek áp dụng để huấn luyện đối thủ cạnh tranh của OpenAI, phương pháp SFT giúp giảm đáng kể chi phí cũng như thời gian huấn luyện.

artificial intelligence
Sử dụng kỹ thuật "chưng cất" kiến thức, mô hình AI mới dù có giá rẻ hơn nhưng cũng có nhiều tính năng tương đương của OpenAI

Quá trình huấn luyện mô hình s1 diễn ra nhanh chóng chỉ trong chưa đầy 30 phút, sử dụng 16 GPU NVIDIA H100 – mỗi chiếc GPU có giá thuê khoảng 25.000 USD nhưng thông qua dịch vụ điện toán đám mây, tổng chi phí thuê chỉ dưới 50 USD. Một thủ thuật thú vị khác mà các nhà nghiên cứu áp dụng là cho mô hình “chờ” (wait) trong quá trình suy luận, giúp s1 kiểm tra lại công việc của mình và kéo dài thời gian “suy nghĩ” để cho ra các câu trả lời chính xác hơn.

Mặc dù những kết quả đạt được của s1 đã mở ra nhiều cơ hội đổi mới trong không gian AI, nhưng đồng thời cũng đặt ra câu hỏi về quá trình “phân hóa” (commoditization) các mô hình AI. Khi mà một nhóm các nhà nghiên cứu với nguồn lực hạn chế có thể tái tạo lại những khả năng của một mô hình trị giá hàng triệu đô la chỉ với một khoản “túi tiền” khiêm tốn, thì ranh giới giữa đổi mới và việc “sao chép” dường như trở nên mỏng manh. Điều này không làm hài lòng các phòng thí nghiệm AI lớn; OpenAI chẳng hạn đã cáo buộc DeepSeek sử dụng dữ liệu từ API của mình không đúng cách nhằm mục đích chưng cất mô hình.

Trong khi đó, các ông lớn như Meta, Google và Microsoft dự kiến sẽ đầu tư hàng trăm tỷ đô la trong năm 2025 cho cơ sở hạ tầng AI, với một phần nguồn lực dành cho việc huấn luyện các mô hình thế hệ tiếp theo. Tuy nhiên, thành tựu của mô hình s1 cho thấy rằng, đối với một số ứng dụng nhất định, việc áp dụng các kỹ thuật như chưng cất và huấn luyện giám sát có thể mang lại những kết quả ấn tượng với chi phí tương đối thấp.

Dù phương pháp này cho phép “tái tạo” các khả năng của một mô hình hiện có một cách tiết kiệm, nó cũng chỉ chứng minh được khả năng nhân rộng các chức năng hiện tại chứ không tạo ra những bước đột phá vượt trội so với những gì đã có.

Nguyễn Hải

Cùng chuyên mục

SEA Games 33: Tuyển Việt Nam so tài Malaysia

Thứ 6, 05/12/2025 15:29
Trận đấu Việt Nam vs Malaysia diễn ra lúc 18h30 ngày 5/12 thuộc khuôn khổ vòng bảng môn bóng đá nữ SEA Games 33

Huawei tung ưu đãi lớn dịp cuối năm, miễn phí sửa chữa và quà tặng giá trị lên đến hàng triệu đồng

Thứ 6, 05/12/2025 15:29
Chương trình này sẽ được kéo dài từ nay cho tới hết 31/12.

7 loại cây có khả năng hút khí độc, lọc sạch 85% không khí trong 24h, nên trồng ngay trong những ngày ô nhiễm nặng

Thứ 6, 05/12/2025 15:03
Những ngày chất lượng không khí xuống thấp, nhiều gia đình tìm đến cây xanh như một “lá chắn” tự nhiên trước ô nhiễm. Dựa trên các nghiên cứu khoa học, 7 loại cây dưới đây được ghi nhận có khả năng hấp thụ một số khí độc, hỗ trợ làm sạch không gian sống của bạn.

Năm 2025, Viện Ung bướu TP HCM tiếp nhận 1,08 triệu lượt khám, tăng hơn 200.000 lượt so với năm 2024

Thứ 6, 05/12/2025 15:02
Việt Nam có hơn 180.400 ca mắc mới và hơn 120.000 trường hợp tử vong do ung thư. Ung thư hiện là nguyên nhân gây tử vong sớm đứng thứ hai tại Việt Nam, chỉ sau bệnh lý tim mạch.

Xem TRỰC TIẾP bóng đá SEA Games 33: Myanmar vs Philippines

Thứ 6, 05/12/2025 14:13
Trận đấu Myanmar vs Philippines diễn ra lúc 16h00 ngày 5/12 thuộc khuôn khổ vòng bảng SEA Games 33.
     
Nổi bật trong ngày

Nghiên cứu hành vi của hơn 200 trẻ, chuyên gia chỉ ra: Những đứa trẻ hạnh phúc nhất đều có cha mẹ làm 8 điều này vào mỗi buổi sáng

Thứ 5, 04/12/2025 07:39
Những thói quen buổi sáng của cha mẹ có ảnh hưởng trực tiếp đến cảm xúc, khả năng tập trung và mức độ hạnh phúc của trẻ trong cả ngày

Toàn đội T1 sẽ qua Việt Nam, khán giả tiếc nuối 1 cái tên

Thứ 5, 04/12/2025 13:06
Thông báo mới nhất về T1 khiến nhiều người vừa phấn khích nhưng cũng có xen lẫn tiếc nuối.

Trẻ có trí tuệ cảm xúc thấp thường nói 3 CÂU quen thuộc này mong rằng con bạn chưa từng thốt ra

Thứ 5, 04/12/2025 18:49
Khi nhận thấy con mình thường xuyên nói những câu cửa miệng tiêu cực, phụ huynh nên coi đó là “tín hiệu sớm” để can thiệp.

Điện thoại màn gập đẹp như Z Flip7 những giá rẻ hơn, camera đơn nhưng pin lớn, giá dự kiến chỉ khoảng 15 triệu

Thứ 6, 05/12/2025 01:10
Nubia giới thiệu Flip3 như mẫu máy gập vỏ sò tầm trung kế nhiệm Flip2, dùng Dimensity 7400X và màn hình phụ 4 inch, dự kiến mở bán từ giữa tháng 1 tại thị trường Nhật Bản.

Royal Capital Group có Tổng Giám đốc Điều hành mới

Thứ 6, 05/12/2025 10:22
Royal Capital Group, chủ sở hữu Wyndham Hoi An Royal Beachfront Resort, Royal Beachfront Villas Danang và Hotel Royal Hoi An Danang, vừa bổ nhiệm ông Sven A. Saebel giữ vị trí Tổng Giám đốc Điều hành.
xe.nguoiduatin.vn