Ít ai biết chatbot Claude được

Ít ai biết chatbot Claude được "nuôi dạy" bởi một triết gia, với bản hướng dẫn đạo đức dài tới 30.000 từ

Thứ 7, 07/03/2026 06:00
Đằng sau chatbot Claude của Anthropic là một triết gia chịu trách nhiệm viết bộ quy tắc đạo đức dài hàng chục nghìn từ, nhằm dạy AI cách ứng xử, từ chối yêu cầu nguy hiểm và giao tiếp với con người theo cách tử tế hơn.

Khi nhắc tới các chatbot AI như Claude, nhiều người nghĩ đến kỹ sư, nhà khoa học dữ liệu hoặc các chuyên gia machine learning. Nhưng tại Anthropic, công ty đứng sau Claude, một trong những người quan trọng nhất lại là… một triết gia.

Amanda Askell, triết gia và là nhà nghiên cứu AI tại Anthropic

Amanda Askell, nhà nghiên cứu làm việc tại trụ sở Anthropic ở San Francisco, đang phụ trách một nhiệm vụ khá đặc biệt. Công việc của cô là xây dựng bộ quy tắc đạo đức và hành vi cho Claude. Nói đơn giản, cô giúp định hình cách AI này "cư xử" khi nói chuyện với con người.

Để làm điều đó, Askell đã viết một tài liệu hướng dẫn dài khoảng 30.000 từ. Nội dung của tài liệu giống như một bộ hiến pháp thu nhỏ dành cho AI. Trong đó mô tả các nguyên tắc mà Claude cần tuân theo khi phản hồi người dùng, cách xử lý những câu hỏi nhạy cảm và cách từ chối các yêu cầu nguy hiểm.

Những hướng dẫn này là nền tảng cho phương pháp mà Anthropic gọi là Constitutional AI. Thay vì chỉ huấn luyện AI bằng dữ liệu và phản hồi của con người, công ty còn cung cấp cho mô hình một tập hợp nguyên tắc đạo đức để tự đánh giá và điều chỉnh câu trả lời của mình.

Một phần quan trọng của tài liệu liên quan tới cách Claude phản ứng với những tình huống khó xử. Ví dụ khi người dùng cố gắng yêu cầu AI tạo nội dung nguy hiểm, lừa đảo hoặc thao túng người khác. Trong những trường hợp này, Claude được hướng dẫn phải từ chối một cách rõ ràng, đồng thời giải thích lý do thay vì trả lời mơ hồ.

Ngoài việc từ chối các yêu cầu nguy hiểm, Anthropic cũng muốn Claude thể hiện cách giao tiếp lịch sự và có tính thấu cảm hơn. Điều này không có nghĩa là AI thực sự có cảm xúc. Thực tế, nó chỉ là cách thiết kế phản hồi sao cho phù hợp với ngữ cảnh của cuộc trò chuyện và tránh gây tổn thương cho người dùng.

Vai trò của Askell vì thế khá khác so với hình dung quen thuộc về ngành AI. Thay vì viết code hay xây dựng mô hình, cô phải suy nghĩ về các câu hỏi đạo đức, triết học và hành vi xã hội. Sau đó chuyển chúng thành những nguyên tắc đủ rõ ràng để một hệ thống trí tuệ nhân tạo có thể áp dụng.

Câu chuyện này cho thấy một điều thú vị về ngành AI hiện nay. Khi các mô hình ngày càng mạnh và phổ biến, việc quyết định cách chúng nên cư xử với con người cũng trở thành một bài toán lớn. Và đôi khi, người được giao nhiệm vụ đó không phải là kỹ sư, mà là một triết gia.

Có thể nói, phía sau những câu trả lời lịch sự của Claude là hàng chục nghìn từ hướng dẫn được viết ra để dạy AI cách trở thành một "người nói chuyện tử tế". Và nếu chatbot đôi lúc từ chối trả lời bạn một cách rất lịch sự, rất có thể đó chính là lúc bản hiến pháp 30.000 từ kia đang phát huy tác dụng.

Thế Duyệt

Cùng chuyên mục

Giám đốc ở Hà Nội sắm VinFast EC Van thay xe tải chở hàng trong phố, tính trải nghiệm lái xuyên Việt khi có thời gian

Thứ 7, 07/03/2026 09:35
Tin tưởng dòng xe điện sau khi sở hữu 3 chiếc VF 9, anh Vũ Ngọc Hải tiếp tục đầu tư EC Van làm giải pháp vận tải cho doanh nghiệp. Đây là bước đi thực dụng giúp duy trì chuỗi cung ứng trước quy định hạn chế xe tải tại Thủ đô.

Chủ tịch FPT IS gia nhập Ban Chấp hành Hiệp hội Dữ liệu Quốc gia nhiệm kỳ mới

Thứ 7, 07/03/2026 09:31
Ngày 3/3/2026, ông Trần Đăng Hòa chính thức được bầu làm Ủy viên Ban Chấp hành Hiệp hội Dữ liệu Quốc gia, đồng thời giữ chức Trưởng ban Hợp tác đối ngoại của hiệp hội.

Người Việt mua trung bình hơn 3.600 xe máy Honda mỗi ngày trong 30 năm qua, hãng làm hẳn 3 nhà máy, nội địa hóa hơn 96% để đáp ứng

Thứ 7, 07/03/2026 07:37
Kỷ niệm 30 năm hoạt động tại Việt Nam vào năm 2026, Honda xác lập cột mốc cung ứng hơn 40 triệu xe máy ra thị trường. Mảng ô tô cũng được hãng đẩy mạnh với thêm sản phẩm được nội địa hóa.

Galaxy S26+: Điện thoại dành cho người muốn bước vào kỷ nguyên AI phone trọn vẹn với mức giá "chưa phải Ultra"

Thứ 7, 07/03/2026 07:21
Galaxy S26+ đáng mua nhất nếu bạn muốn một chiếc flagship dùng sướng mỗi ngày và trải nghiệm đầy đủ Galaxy AI mới nhất.

Mở bán Galaxy S26 series tại Việt Nam: Bản Ultra chiếm tới 90%

Thứ 7, 07/03/2026 07:00
Galaxy S26 series mở bán tại Việt Nam từ 0 giờ ngày 6/3. Nhiều hệ thống bán lẻ ghi nhận lượng đặt trước tăng mạnh, trong đó phiên bản Ultra chiếm phần lớn.
     
Nổi bật trong ngày

Malaysia sai phạm rõ ràng, Việt Nam đoạt vé châu Á sớm nhưng vẫn còn đó một món nợ phải trả!

Thứ 6, 06/03/2026 07:49
Với việc CAS nhận định LĐBĐ Malaysia có sai phạm trong việc "nhập lậu" 7 cầu thủ, ĐT Malaysia gần như chắc chắn sẽ nhận án thua ngược 2 trận từ AFC nhưng như thế là chưa đủ!

Bánh mì liên tiếp gây ngộ độc hàng loạt: Chuyên gia chỉ ra 4 “điểm yếu” nhiều người bán lẫn người ăn đều bỏ qua

Thứ 6, 06/03/2026 12:09
Chỉ trong vài ngày đầu tháng 3, nhiều địa phương phía Nam ghi nhận hàng trăm người có triệu chứng ngộ độc sau khi ăn bánh mì – món ăn vốn quen thuộc và được xem là biểu tượng ẩm thực đường phố của Việt Nam.

Mỹ Tâm và Mai Tài Phến không hề đơn giản

Thứ 6, 06/03/2026 15:59
Cơn sốt mà Mỹ Tâm và Mai Tài Phến mang đến, dù ở bất cứ vai trò nào, đều khó có thể phủ nhận và xem nhẹ.

Thị trường smartphone giảm tốc: Người dùng bắt đầu mua như một khoản đầu tư

Thứ 7, 07/03/2026 00:39
Thị trường smartphone đang bước sang giai đoạn chọn lọc, người dùng ưu tiên độ bền, pin và sự ổn định lâu dài thay vì chạy theo cấu hình. Cuộc cạnh tranh vì thế dịch chuyển mạnh về phân khúc tầm trung.

Tôi là ông bố bỉm sữa, vừa mượn Mitsubishi Xforce du xuân cùng vợ con, sau đây là 3 thứ vô giá mà chiếc hatchback trước đây không mang lại được

Thứ 6, 06/03/2026 11:30
Sau nhiều năm gắn bó cùng Ford Focus, chuyến du xuân trên Mitsubishi Xforce đã thay đổi góc nhìn của tôi. Khi ưu tiên từ người lái dịch chuyển sang gia đình, sự rộng rãi và thực dụng mới là giá trị cốt lõi cần tìm kiếm.
xe.nguoiduatin.vn