AI Claude Opus 4.6 viết lại trình biên dịch C chỉ trong hai tuần và ngốn nửa tỷ đồng: Thành quả đáng chú ý nhưng lại nhiều rủi ro tiềm ẩn!

AI Claude Opus 4.6 viết lại trình biên dịch C chỉ trong hai tuần và ngốn nửa tỷ đồng: Thành quả đáng chú ý nhưng lại nhiều rủi ro tiềm ẩn!

Thứ 3, 10/02/2026 11:00
Anthropic đã cho 16 AI Claude hoạt động song song để xây dựng một trình biên dịch C từ đầu. Dù tạo ra sản phẩm có thể biên dịch nhân Linux, dự án vẫn đặt ra những lo ngại về khả năng phát triển phần mềm tự động hoàn toàn trong tương lai.

Một thử nghiệm quy mô lớn do Nicholas Carlini, nhà nghiên cứu thuộc nhóm Safeguards của Anthropic, thực hiện đã đặt ra những cột mốc mới trong khả năng phát triển phần mềm tự động bằng AI. Dựa trên mô hình Claude Opus 4.6, ông đã tổ chức một đội agents gồm 16 phiên bản Claude làm việc song song, với mục tiêu xây dựng một trình biên dịch C từ đầu bằng ngôn ngữ Rust.

Kết quả thu được sau gần 2.000 phiên làm việc Claude Code trong vòng hai tuần là một trình biên dịch với khoảng 100.000 dòng mã, có khả năng biên dịch nhân Linux 6.9 trên các kiến trúc x86, ARM và RISC-V. Dự án tiêu tốn chi phí API lên tới gần 20.000 USD, tương đương khoảng 528 triệu đồng.

 

AI Agents của Claude hoạt động như nào?

Không giống như các phiên bản Claude vốn chỉ có một instance hoạt động độc lập và sẽ đóng vai trò khác nhau cho mỗi agent, hệ thống này được thiết kế để cho phép nhiều agents Claude làm việc đồng thời trên cùng một mã nguồn mà không cần sự giám sát trực tiếp của con người. Mỗi agent hoạt động trong một container riêng biệt, context riêng biệt, sử dụng một vòng lặp liên tục để nhận nhiệm vụ, xử lý và đẩy kết quả trở lại git repo chung.

Để tránh xung đột nhiệm vụ, mỗi Claude sẽ ghi lại một tập tin khóa cho tác vụ đang xử lý. Hệ thống đồng bộ đảm bảo nếu một agent khác cố gắng nhận cùng nhiệm vụ, nó sẽ buộc phải chọn nhiệm vụ khác. Khi hoàn thành, Claude sẽ hợp nhất mã nguồn, xử lý xung đột và tiếp tục vòng lặp.

Dù là một nguyên mẫu còn đơn giản, không có hệ thống điều phối tác vụ tổng thể (hay còn gọi là orchestrator), các Claude vẫn có khả năng tự xác định nhiệm vụ tiếp theo và ghi lại tiến trình. Ngoài những Claude chính viết trình biên dịch, một số agents khác được giao nhiệm vụ chuyên biệt như: rà soát mã trùng lặp, tối ưu hiệu năng, đánh giá kiến trúc mã dưới góc nhìn của lập trình viên Rust, hay hoàn thiện tài liệu kỹ thuật.

Thách thức kỹ thuật và các giới hạn

Dù đạt được những kết quả đáng chú ý, Carlini thừa nhận trình biên dịch này vẫn còn nhiều giới hạn. Trình biên dịch chưa thể thay thế hoàn toàn các công cụ hiện có như GCC, khi:

- Chưa có khả năng xử lý chế độ thực 16-bit cần thiết để khởi động Linux. Phần này vẫn phụ thuộc vào GCC.

- Chưa tích hợp bộ hợp dịch (assembler) và bộ liên kết (linker) của riêng mình, hai thành phần mà Claude mới chỉ bắt đầu xây dựng và còn tồn tại lỗi.

- Mã biên dịch đầu ra kém hiệu quả hơn so với mã do GCC tạo ra, ngay cả khi đã bật tất cả tối ưu hóa.

- Chất lượng mã Rust nhìn chung ổn định, nhưng vẫn còn khoảng cách lớn so với sản phẩm của lập trình viên chuyên nghiệp.

Một giải pháp được áp dụng để đẩy mạnh quá trình phát triển là sử dụng GCC làm trình biên dịch tham chiếu. Claude chỉ biên dịch một phần mã, phần còn lại được xử lý bằng GCC để xác định chính xác vị trí lỗi, từ đó mỗi agent có thể làm việc song song và khắc phục các lỗi riêng biệt.

Thành tựu của Claude Opus 4.6 càng trở nên đáng chú ý khi đặt trong bối cảnh lịch sử phát triển phần mềm. Trình biên dịch C đầu tiên, do Dennis Ritchie viết vào đầu thập niên 1970, đã mất khoảng 2 năm để hoàn thiện, với sự tham gia của nhiều kỹ sư tại Bell Labs. Khi đó, tài nguyên tính toán hạn chế, ngôn ngữ lập trình còn non trẻ, và quy trình phát triển phần mềm chưa được chuẩn hóa như hiện nay.

So sánh như vậy để thấy rằng, dù Claude chưa tạo ra một sản phẩm hoàn chỉnh, việc một hệ thống AI có thể xây dựng được một trình biên dịch khả thi chỉ trong hai tuần, với chi phí tương đương mức lương hai tháng của một kỹ sư phần mềm tại Mỹ, là một bước tiến đáng kể về mặt công nghệ.

Rủi ro của phát triển phần mềm tự động

Carlini nhấn mạnh rằng, dù khả năng của việc lập trình bằng các agents team đang mở ra tiềm năng lớn trong phát triển phần mềm, rủi ro an toàn cũng cần được đặc biệt lưu ý. Việc triển khai phần mềm do AI viết mà không qua kiểm tra thủ công tiềm ẩn nhiều nguy cơ, nhất là trong các hệ thống đòi hỏi độ tin cậy cao bởi agents team thường hoạt động một cách tự động mà không cần con người can thiệp.

Dự án này không chỉ đóng vai trò là một thử nghiệm kỹ thuật mà còn là công cụ đánh giá năng lực của các thế hệ mô hình Opus. Carlini cho biết Claude Opus 4.5 mới chỉ đủ khả năng tạo trình biên dịch vượt qua bộ kiểm thử cơ bản. Chỉ đến phiên bản 4.6, mô hình mới đạt đủ năng lực để xây dựng phần mềm ở quy mô lớn như biên dịch nhân Linux.

Dù vẫn còn nhiều hạn chế, tác giả tin rằng hướng phát triển này sẽ tiếp tục mở rộng. Carlini kết luận: "Tôi không nghĩ rằng khả năng này có thể đạt được sớm như vậy trong năm 2026. Chúng ta đang bước vào một kỷ nguyên mới của phát triển phần mềm, nơi cần có những chiến lược phù hợp để khai thác hiệu quả và an toàn sức mạnh của AI."

Thế Duyệt

Cùng chuyên mục

Sếp Omoda & Jaecoo Việt Nam 'phản pháo' vụ so sánh xe ngập nước: ‘Ngập nóc khác ngập sàn, nằm xưởng lâu là do bảo hiểm’

Thứ 3, 10/02/2026 13:00
Tính chất 2 vụ xe ngập nước khác nhau nên quy trình xử lý cũng khác nhau. Việc giải quyết lâu còn liên quan tới cả bảo hiểm.

Samsung ra mắt điện thoại pin 6.000mAh, chip Dimensity, giá rẻ chỉ hơn 3 triệu

Thứ 3, 10/02/2026 12:00
Samsung tiếp tục mở rộng dòng F-series với Galaxy F70e, mẫu smartphone giá rẻ sở hữu pin dung lượng lớn, màn hình 120 Hz và cam kết hỗ trợ phần mềm dài hạn.

Sau thời gian dài chờ đợi, cuối cùng Apple đã chính thức mở Đơn đăng ký Thử Thách Swift Dành Cho Học Sinh - Sinh Viên

Thứ 3, 10/02/2026 11:17
Đúng như kỳ vọng, "sân chơi" trí tuệ lớn nhất năm của Apple dành cho các lập trình viên trẻ đã chính thức khởi động.

Mía chằng kín xe máy, cá chép đỏ rực bến sông: TP.HCM - Hà Nội rộn ràng tiễn ông Công ông Táo ngày 23 tháng Chạp

Thứ 3, 10/02/2026 11:00
Ngày 23 tháng Chạp, người dân TP.HCM và Hà Nội dậy sớm sắm lễ, mua mía, thả cá chép tiễn ông Công ông Táo trong không khí rộn ràng, đồng thời nâng cao ý thức bảo vệ môi trường với thông điệp “thả cá, không thả rác”.

Đúng là chỉ có Xiaomi: Ra mắt gần một năm nhưng máy này vẫn bán cực chạy, thiết kế đẹp, pin khủng, chơi game mượt

Thứ 3, 10/02/2026 11:00
Ra mắt đã gần một năm nhưng REDMI TURBO 4 PRO vẫn chưa hề hạ nhiệt. Với thiết kế đẹp mắt, cấu hình mạnh và viên pin cực khủng, mẫu máy này đang tạo nên cơn sốt ở tầm giá hơn 6 triệu đồng.
     
Nổi bật trong ngày

Sàn tiền số gửi nhầm 44 tỷ USD bitcoin cho người dùng, 695 khách hàng nhận thông báo bất ngờ

Thứ 2, 09/02/2026 09:18
Sàn giao dịch tiền điện tử Bithumb của Hàn Quốc mới đây đã vô tình phân phát hơn 40 tỷ USD bitcoin cho khách hàng, theo hãng tin Reuters.

TP.HCM: Bé trai 10 tuổi bị đột quỵ, nhồi máu não, cha mẹ cần lưu ý ngay những dấu hiệu quan trọng

Thứ 2, 09/02/2026 14:51
Bệnh viện Nhi Đồng Thành Phố (TP.HCM) vừa điều trị thành công một trường hợp nhồi máu não cấp hiếm gặp ở trẻ em, giúp bé trai 10 tuổi tránh được nguy cơ liệt nửa người vĩnh viễn nhờ can thiệp nội mạch khẩn cấp.

Mercedes-AMG tất tay vào canh bạc xe điện: Siêu SUV 1.000 mã lực và tham vọng định hình lại cuộc chơi tốc độ

Thứ 3, 10/02/2026 10:00
Giữa lúc thị trường xe điện đang có những bước chuyển mình đầy biến động, Mercedes-AMG lại chọn cách "đạp ga" mạnh mẽ hơn bao giờ hết.

Hướng dẫn tra cứu lịch sử khám chữa bệnh, đơn thuốc bảo hiểm y tế trên VNeID

Thứ 2, 09/02/2026 09:34
VNeID được kỳ vọng thay thế dần các loại giấy tờ truyền thống, hướng tới xây dựng hệ sinh thái số trong quản lý hành chính và y tế.
xe.nguoiduatin.vn