Bài đăng trên blog tiết lộ GPT-4 đi sâu vào chi tiết về các tính năng mới và cải tiến hiệu suất. Có lẽ tính năng mới lớn nhất là GPT-4 có thể trả lời các câu hỏi kết hợp cả văn bản và hình ảnh. Blog nêu rõ “Trên nhiều miền, bao gồm cả tài liệu có văn bản và ảnh, sơ đồ hoặc ảnh chụp màn hình, GPT-4 thể hiện các khả năng tương tự như trên đầu vào chỉ có văn bản. Hơn nữa, nó có thể được tăng cường bằng các kỹ thuật thời gian kiểm tra đã được phát triển cho các mô hình ngôn ngữ chỉ có văn bản, bao gồm nhắc nhở theo chuỗi suy nghĩ”.
Tin xấu là đầu vào hình ảnh hiện không có sẵn cho công chúng vì chúng ở chế độ “xem trước nghiên cứu”, đồng thời vẫn chưa có thông tin nào về thời điểm tính năng này có sẵn.
Phiên bản mới cũng sẽ cho phép người dùng thay đổi giọng điệu của câu trả lời của GPT-4. Blog nêu rõ “Thay vì tính cách ChatGPT cổ điển với độ dài, giọng điệu và phong cách cố định, các nhà phát triển (và sắp tới là người dùng ChatGPT) giờ đây có thể quy định phong cách và nhiệm vụ AI của họ bằng cách mô tả các hướng đó trong thông báo “hệ thống”. Thông báo hệ thống cho phép tùy chỉnh trải nghiệm API của người dùng trong giới hạn”.
Blog cũng hiển thị một số biểu đồ hiệu suất để minh họa cho những cải tiến của GPT-4. Trong một trường hợp, OpenAI đã cho chatbot một số bài kiểm tra mô phỏng thực hiện các câu trả lời miễn phí của Olympic và AP.
Cũng như các phiên bản trước, GPT-4 bị hạn chế trong việc nhận thêm thông tin mới hơn về các chủ đề vì nó chỉ có thể lấy dữ liệu cuối cùng vào tháng 9/2021. OpenAI cũng cho biết phiên bản mới “giảm đáng kể ảo giác so với các mẫu trước đó”, nhưng nó “không hoàn toàn đáng tin cậy”.
API GPT-4 hiện có sẵn để nhà phát triển truy cập nếu họ đăng ký danh sách chờ. Công chúng nói chung có thể dùng thử GPT-4 trên cơ sở hạn chế nếu họ đăng ký ChatGPT Plus với giá 20 USD/tháng. Bài đăng trên blog đề cập đến OpenAI có thể khởi chạy một cấp đăng ký khác sẽ cho phép mức truy cập cao hơn.
Thái An