Phân tích 6.852 phiên làm việc, giám đốc AI của AMD cảnh báo: Claude Code ngốc hơn và lười biếng hơn, không còn đáng tin cho các tác vụ phức tạp

Phân tích 6.852 phiên làm việc, giám đốc AI của AMD cảnh báo: Claude Code ngốc hơn và lười biếng hơn, không còn đáng tin cho các tác vụ phức tạp

Thứ 2, 13/04/2026 17:33
Không chỉ suy giảm chất lượng xử lý tác vụ, điều đáng ngại hơn cả là việc Anthropic, công ty tạo ra Claude Code, lại không hề thông báo cho người dùng về sự thay đổi trong hành vi của AI này.

Vào thứ Sáu tuần trước, bà Stella Laurenzo, giám đốc nhóm AI của hãng AMD, vừa đăng một báo cáo dài trên GitHub, tổng hợp những gì đội AMD quan sát được trong nhiều tháng qua với kết luận:

"Claude không thể tin cậy để thực hiện các tác vụ kỹ thuật phức tạp," bà viết, nhấn mạnh rằng đội ngũ đã đưa ra kết luận này sau khi xem xét hàng tháng trời nhật ký làm việc từ một môi trường "rất ổn định, độ phức tạp cao". "Mọi kỹ sư cao cấp trong đội tôi đều báo cáo những trải nghiệm và câu chuyện tương tự," bà Laurenzo nói thêm.

Con số không nói dối. Bà Laurenzo và đội ngũ đã phân tích 6.852 phiên làm việc với Claude Code, bao gồm 234.760 lần gọi công cụ và 17.871 khối suy nghĩ. Dữ liệu cho thấy một bức tranh đáng lo ngại.

claude 125144834 16x90
Bà Stella Laurenzo, giám đốc nhóm AI của hãng AMD

Số lần vi phạm stop-hook - những dấu hiệu cho thấy AI đang "lười biếng", né tránh trách nhiệm, ngừng suy nghĩ sớm và liên tục xin phép thay vì tự làm - tăng vọt từ mức không một lần nào trước ngày 8 tháng 3 lên trung bình 10 lần mỗi ngày cho đến cuối tháng đó.

Số lần Claude đọc qua đoạn code trước khi thực hiện thay đổi cũng giảm mạnh, từ trung bình 6,6 lần xuống chỉ còn 2 lần vào cuối tháng 3. Điều này có nghĩa là AI đang sửa code mà hầu như không hiểu nó đang làm gì. Tệ hơn nữa, trong cùng khoảng thời gian đó, Claude bắt đầu viết lại toàn bộ file thay vì chỉ chỉnh sửa những phần cần thiết - một dấu hiệu rõ ràng của sự lười biếng.

Tất cả những điều này, theo Laurenzo, chỉ ra rằng Claude Code không còn suy nghĩ sâu sắc như trước. Và thời điểm suy giảm này trùng khớp với việc Anthropic triển khai "thinking content redaction" - tính năng ẩn quá trình suy nghĩ - trong phiên bản Claude Code 2.1.69 vào đầu tháng 3.

Thinking redaction hoạt động như một thiết lập mặc định ẩn đi nội dung suy nghĩ từ phản hồi của Claude Code, nghĩa là người dùng không biết được Claude Code thực sự đang làm gì trong khi nó suy nghĩ về một yêu cầu. Bằng chứng, theo Laurenzo, chỉ ra một sự giảm sút chung về mức độ suy nghĩ kể từ khi tính năng này được áp dụng.

claude code

"Khi suy nghĩ nông, mô hình mặc định chọn hành động rẻ nhất có sẵn: sửa mà không đọc, dừng mà chưa hoàn thành, né tránh trách nhiệm khi thất bại, chọn giải pháp đơn giản nhất thay vì giải pháp đúng," báo cáo trên GitHub giải thích. "Đây chính xác là những triệu chứng chúng tôi quan sát được."

Nhưng còn tệ hơn nữa. Anthropic đã âm thầm thay đổi mức độ nỗ lực mặc định từ "cao" xuống "trung bình" và giới thiệu "adaptive thinking" - cho phép AI tự quyết định mức độ suy luận. Không có thông báo. Không có cảnh báo. Khi người dùng chia sẻ bản ghi, kỹ sư của chính Anthropic xác nhận mô hình đang phân bổ KHÔNG thinking token ở một số lượt. Và những lượt có mức suy luận bằng không? Chính xác là những lúc AI "ảo giác" - nghĩ ra những thứ không có thật.

Đối với AMD, hậu quả rất thực tế. Toàn bộ quy trình làm việc về AI compiler của họ được xây dựng xung quanh Claude Code, với hơn 50 phiên đồng thời chạy trên một công cụ. Một bản cập nhật âm thầm đã phá vỡ mọi thứ. "Chúng tôi đã chuyển sang một nhà cung cấp khác đang làm công việc chất lượng cao hơn, nhưng Claude từng tốt với chúng tôi, và chúng tôi để lại thông tin này với hy vọng Anthropic có thể sửa sản phẩm của họ," Laurenzo giải thích.

Bà từ chối tiết lộ công cụ mới mà đội ngũ đang dùng, nói rằng các thỏa thuận bảo mật ngăn cản việc đó. Nhưng bà cảnh báo Anthropic rằng trò chơi viết code bằng AI vẫn còn ở giai đoạn đầu và Anthropic đang có nguy cơ mất vị trí dẫn đầu nếu hành vi này tiếp tục.

6826a6227b1fbd47034d1936claude code

"Tất cả những gì tôi có thể nói thêm là 6 tháng trước, Claude đứng một mình về chất lượng suy luận và khả năng thực thi," bà Laurenzo nói thêm trong một phản hồi. "Nhưng những đối thủ khác cần được theo dõi và đánh giá rất cẩn thận. Anthropic không còn độc tôn ở tầng khả năng mà Opus từng chiếm giữ."

Bà Laurenzo yêu cầu Anthropic minh bạch về việc liệu họ có đang giảm hoặc giới hạn thinking tokens hay không, và ít nhất cũng cần hiển thị số lượng thinking tokens được sử dụng cho mỗi yêu cầu để người dùng có thể giám sát liệu yêu cầu của họ có nhận được độ sâu suy luận cần thiết hay không.

Bà cũng yêu cầu Anthropic thêm một gói cao cấp đảm bảo "suy nghĩ sâu" cho các kỹ sư chạy quy trình phức tạp. "Mô hình đăng ký hiện tại không phân biệt giữa người dùng cần 200 thinking tokens mỗi phản hồi và người dùng cần 20.000," bà giải thích. "Người dùng chạy quy trình kỹ thuật phức tạp sẽ sẵn sàng trả nhiều hơn đáng kể để đảm bảo có suy nghĩ sâu."

Đây không phải vấn đề riêng của AMD. Nhiều người dùng khác trên Reddit và GitHub đều bày tỏ cảm giác tương tự. Và đây cũng không phải lần đầu Anthropic gặp rắc rối - họ vừa bị phê phán vì tăng đột ngột mức sử dụng token khiến nhiều người dùng vượt giới hạn, cùng với việc toàn bộ mã nguồn của Claude Code bị lộ gần đây.

Nguyễn Hải

Cùng chuyên mục

Quy định liên quan đến giấy khai sinh áp dụng từ 18/5 tới, người dân cần nắm rõ

Thứ 2, 13/04/2026 19:28
Từ 18/5/2026, vi phạm trong đăng ký khai sinh có thể bị phạt đến 5 triệu đồng.

Lệnh giữ người khẩn cấp với Đinh Văn Hùng SN 1996 trong đường dây hoạt động tinh vi

Thứ 2, 13/04/2026 19:27
Phòng CSHS đã huy động hơn 60 cán bộ, chiến sĩ là điều tra viên, trinh sát viên dày dạn kinh nghiệm, tổ chức nhiều tổ công tác đồng loạt triển khai các biện pháp nghiệp vụ.

Ông bố lương gần 28 triệu, 1 mình nuôi 2 con: Cách chi tiêu khiến nhiều mẹ bỉm hổ thẹn

Thứ 2, 13/04/2026 19:24
Không ít chị em phải thừa nhận bản thân quản lý chi tiêu chưa tốt bằng ông bố này.

Sau trận thua 14 bàn, tuyển Việt Nam chơi kiên cường, thu về bài học quý khi tái đấu đội bóng châu Âu

Thứ 2, 13/04/2026 19:01
Các cầu thủ trẻ Việt Nam đã thu về nhiều bài học kin nghiệm sau 2 trận đấu trước đối thủ đẳng cấp thế giới.

5 trường hợp bị khóa SIM, chặn gọi sau 15/4, người dân cần biết

Thứ 2, 13/04/2026 19:01
Từ ngày 15/4/2026, nhà mạng sẽ thực hiện khóa SIM, chặn gọi điện, nhắn tin với các SIM không chính chủ.
     
Nổi bật trong ngày

3 loại cây rất hợp với người trẻ: Biết trồng thì khỏe toàn thân

Chủ nhật, 12/04/2026 05:00
Người trẻ bận rộn vẫn có thể khỏe mạnh hơn mỗi ngày chỉ nhờ vài chậu cây nhỏ. Chọn đúng loại cây không chỉ làm đẹp không gian mà còn cải thiện thể chất, tinh thần.

Nam thanh niên 27 tuổi bị liệt cánh tay sau giờ chợp mắt ngủ trưa: Bác sĩ Bệnh viện Bạch Mai cảnh báo 1 thói quen gây tổn thương nghiêm trọng

Chủ nhật, 12/04/2026 09:31
Mới đây, các bác sĩ Y học cổ truyền, Bệnh viện Bạch Mai lên tiếng chia sẻ về 1 căn bệnh thông qua trường hợp 1 nam bệnh nhân 27 tuổi.

Mẹ mất 45 phút bóc vỏ việt quất cho con, không ngờ lại bị chỉ trích: "Yêu sai cách còn nguy hiểm hơn không yêu"

Chủ nhật, 12/04/2026 12:17
Một hành động xuất phát từ tình thương lại bị cộng đồng mạng phản ứng dữ dội, cho thấy ranh giới mong manh giữa yêu thương và áp đặt.

Tạm giữ hình sự Trần Thị Thu Hà sinh năm 1994

Chủ nhật, 12/04/2026 13:56
Lực lượng công an vừa bắt quả tang nhóm thanh niên tụ tập “bay lắc" tập thể trong đó có Trần Thị Thu Hà.

Thông tin mới nhất về nhắn tin qua Zalo mà người dân cần nắm rõ

Chủ nhật, 12/04/2026 17:08
Người dân lưu ý, tin nhắn Zalo kiểu này thực chất là chiêu trò lừa đảo chiếm quyền tài khoản.
xe.nguoiduatin.vn