Ít ai biết chatbot Claude được "nuôi dạy" bởi một triết gia, với bản hướng dẫn đạo đức dài tới 30.000 từ

Khi nhắc tới các chatbot AI như Claude, nhiều người nghĩ đến kỹ sư, nhà khoa học dữ liệu hoặc các chuyên gia machine learning. Nhưng tại Anthropic, công ty đứng sau Claude, một trong những người quan trọng nhất lại là… một triết gia.

Amanda Askell, triết gia và là nhà nghiên cứu AI tại Anthropic

Amanda Askell, nhà nghiên cứu làm việc tại trụ sở Anthropic ở San Francisco, đang phụ trách một nhiệm vụ khá đặc biệt. Công việc của cô là xây dựng bộ quy tắc đạo đức và hành vi cho Claude. Nói đơn giản, cô giúp định hình cách AI này "cư xử" khi nói chuyện với con người.

Để làm điều đó, Askell đã viết một tài liệu hướng dẫn dài khoảng 30.000 từ. Nội dung của tài liệu giống như một bộ hiến pháp thu nhỏ dành cho AI. Trong đó mô tả các nguyên tắc mà Claude cần tuân theo khi phản hồi người dùng, cách xử lý những câu hỏi nhạy cảm và cách từ chối các yêu cầu nguy hiểm.

Những hướng dẫn này là nền tảng cho phương pháp mà Anthropic gọi là Constitutional AI. Thay vì chỉ huấn luyện AI bằng dữ liệu và phản hồi của con người, công ty còn cung cấp cho mô hình một tập hợp nguyên tắc đạo đức để tự đánh giá và điều chỉnh câu trả lời của mình.

Một phần quan trọng của tài liệu liên quan tới cách Claude phản ứng với những tình huống khó xử. Ví dụ khi người dùng cố gắng yêu cầu AI tạo nội dung nguy hiểm, lừa đảo hoặc thao túng người khác. Trong những trường hợp này, Claude được hướng dẫn phải từ chối một cách rõ ràng, đồng thời giải thích lý do thay vì trả lời mơ hồ.

Ngoài việc từ chối các yêu cầu nguy hiểm, Anthropic cũng muốn Claude thể hiện cách giao tiếp lịch sự và có tính thấu cảm hơn. Điều này không có nghĩa là AI thực sự có cảm xúc. Thực tế, nó chỉ là cách thiết kế phản hồi sao cho phù hợp với ngữ cảnh của cuộc trò chuyện và tránh gây tổn thương cho người dùng.

Vai trò của Askell vì thế khá khác so với hình dung quen thuộc về ngành AI. Thay vì viết code hay xây dựng mô hình, cô phải suy nghĩ về các câu hỏi đạo đức, triết học và hành vi xã hội. Sau đó chuyển chúng thành những nguyên tắc đủ rõ ràng để một hệ thống trí tuệ nhân tạo có thể áp dụng.

Câu chuyện này cho thấy một điều thú vị về ngành AI hiện nay. Khi các mô hình ngày càng mạnh và phổ biến, việc quyết định cách chúng nên cư xử với con người cũng trở thành một bài toán lớn. Và đôi khi, người được giao nhiệm vụ đó không phải là kỹ sư, mà là một triết gia.

Có thể nói, phía sau những câu trả lời lịch sự của Claude là hàng chục nghìn từ hướng dẫn được viết ra để dạy AI cách trở thành một "người nói chuyện tử tế". Và nếu chatbot đôi lúc từ chối trả lời bạn một cách rất lịch sự, rất có thể đó chính là lúc bản hiến pháp 30.000 từ kia đang phát huy tác dụng.

Thế Duyệt

Ít ai biết chatbot Claude được "nuôi dạy" bởi một triết gia, với bản hướng dẫn đạo đức dài tới 30.000 từ

Giám đốc ở Hà Nội sắm VinFast EC Van thay xe tải chở hàng trong phố, tính trải nghiệm lái xuyên Việt khi có thời gian

Chủ tịch FPT IS gia nhập Ban Chấp hành Hiệp hội Dữ liệu Quốc gia nhiệm kỳ mới

Người Việt mua trung bình hơn 3.600 xe máy Honda mỗi ngày trong 30 năm qua, hãng làm hẳn 3 nhà máy, nội địa hóa hơn 96% để đáp ứng

Galaxy S26+: Điện thoại dành cho người muốn bước vào kỷ nguyên AI phone trọn vẹn với mức giá "chưa phải Ultra"

Mở bán Galaxy S26 series tại Việt Nam: Bản Ultra chiếm tới 90%

Malaysia sai phạm rõ ràng, Việt Nam đoạt vé châu Á sớm nhưng vẫn còn đó một món nợ phải trả!

Bánh mì liên tiếp gây ngộ độc hàng loạt: Chuyên gia chỉ ra 4 “điểm yếu” nhiều người bán lẫn người ăn đều bỏ qua

Mỹ Tâm và Mai Tài Phến không hề đơn giản

Thị trường smartphone giảm tốc: Người dùng bắt đầu mua như một khoản đầu tư

Tôi là ông bố bỉm sữa, vừa mượn Mitsubishi Xforce du xuân cùng vợ con, sau đây là 3 thứ vô giá mà chiếc hatchback trước đây không mang lại được

Tin đọc nhiều

Honor 600 Lite ra mắt: Màn hình 6.500 nits, pin 6.520mAh, camera 108MP, giá khoảng 8 triệu

Ghi bàn nhiều hơn Đình Bắc & Thanh Nhàn, chân sút nhà bầu Đức được gọi lên tuyển U23 Việt Nam

iPhone 17e phù hợp với kiểu game thủ nào? Anh em có nên "đầu tư" vào siêu phẩm này ở thời điểm hiện tại?

Hòa Minzy công khai ra mắt bạn trai mặc quân phục, đã được gia đình đồng ý

MacBook Neo mới sẽ cảnh báo nếu người dùng "cắm nhầm lỗ"

Báo giá quảng cáo