Nhồi nhét thành công "cụ tổ ChatGPT" vào... bảng tính Excel dung lượng 1.25GB: Mời tải về và thử nghiệm

Thứ 2, 18/03/2024 13:21
Dù không có giá trị sử dụng thực tế, nhưng đây vẫn là một dự án đầy thú vị, cho phép người dùng hiểu cách một mô hình ngôn ngữ lớn (LLM) hoạt động)

Sự xuất hiện của ChatGPT khiến các mô hình ngôn ngữ lớn (LLM) trở nên phổ biến hơn bao giờ hết. Ishan Anand, một nhà phát triển phần mềm, đã "nhồi nhét" thành công GPT-2 - tiền thân của ChatGPT được OpenAI ra mắt năm 2019 - vào một bảng tính Microsoft Excel. Công cụ này miễn phí và nhằm mục đích giáo dục về cách thức hoạt động của LLM.

"Bằng cách sử dụng bảng tính, bất kỳ ai (ngay cả người không phải lập trình viên) đều có thể khám phá và trực tiếp tương tác với cách thức hoạt động của 'bộ chuyển đổi' thực tế bên trong, ít trừu tượng hóa nhất có thể", Anand viết trên trang web chính thức của bảng tính, có tên là "Spreadsheets-are-all-you-need" (tạm dịch: Chỉ cần bảng tính là đủ). Đây là cách nhắc đến bài nghiên cứu năm 2017 "Attention is All You Need" (tạm dịch: Chỉ cần chú ý là đủ), mô tả lần đầu tiên về kiến trúc Transformer, nền tảng cho hoạt động của LLM.

Anand đã "đóng gói" GPT-2 vào định dạng tệp nhị phân XLSB của Microsoft Excel. Nó yêu cầu phiên bản Excel mới nhất để chạy (không hỗ trợ Excel phiên bản web). Công cụ này hoàn toàn "offline" và không thực hiện bất kỳ kết nối nào đến dịch vụ AI đám mây.

Nhồi nhét thành công "cụ tổ ChatGPT" vào... bảng tính Excel dung lượng 1.25GB: Mời tải về và thử nghiệm- Ảnh 1.

Nhồi nhét thành công "cụ tổ ChatGPT" vào... bảng tính Excel dung lượng 1.25GB: Mời tải về và thử nghiệm- Ảnh 2.

Nhồi nhét thành công "cụ tổ ChatGPT" vào... bảng tính Excel dung lượng 1.25GB: Mời tải về và thử nghiệm- Ảnh 3.

Nhồi nhét thành công "cụ tổ ChatGPT" vào... bảng tính Excel dung lượng 1.25GB: Mời tải về và thử nghiệm- Ảnh 4.

Nhồi nhét thành công "cụ tổ ChatGPT" vào... bảng tính Excel dung lượng 1.25GB: Mời tải về và thử nghiệm- Ảnh 5.

Mặc dù bảng tính chứa một mô hình ngôn ngữ AI hoàn chỉnh, bạn không thể trò chuyện với nó như ChatGPT. Thay vào đó, người dùng nhập các từ vào các ô khác và xem kết quả dự đoán được hiển thị trong các ô khác gần như ngay lập tức. 

Hãy nhớ rằng các mô hình ngôn ngữ như GPT-2 được thiết kế để dự đoán ký tự tiếp theo, nghĩa là chúng cố gắng hoàn thành đầu vào (gọi là lời nhắc, được mã hóa thành các khối gọi là token) với văn bản có khả năng xuất hiện cao nhất. Dự đoán có thể là sự tiếp tục của một câu hoặc bất kỳ tác vụ dựa trên văn bản nào khác, chẳng hạn như mã nguồn phần mềm. Các sheet khác nhau trong tệp Excel của Anand cho phép người dùng nắm bắt hoạt động bên trong khi những dự đoán này diễn ra.

"Spreadsheets-are-all-you-need" chỉ hỗ trợ 10 token đầu vào. Con số này rất nhỏ so với cửa sổ ngữ cảnh 128.000 token của GPT-4 Turbo, nhưng đủ để trình diễn một số nguyên tắc cơ bản về cách hoạt động của LLM.

Bảng tính của Anand sử dụng phiên bản "GPT-2 Small" với 124 triệu tham số, khác với phiên bản đầy đủ 1.5 tỷ tham số của GPT-2. (Tham số là các giá trị số trong mô hình AI lưu trữ các mẫu học được từ dữ liệu huấn luyện). So với 175 tỷ tham số trong GPT-3 (và các mô hình thậm chí còn lớn hơn), phiên bản này có thể không được xếp loại là mô hình ngôn ngữ "lớn" nếu phát hành ngày nay. Nhưng vào năm 2019, GPT-2 được coi là rất tiên tiến.

Bạn có thể tải xuống bảng tính tích hợp GPT-2 trên GitHub, nhưng lưu ý rằng nó nặng khoảng 1,2GB. Do tính phức tạp, Anand cho biết nó có thể khiến Excel bị treo thường xuyên, đặc biệt trên máy Mac; ông khuyên nên chạy bảng tính trên Windows. "Chúng tôi đề xuất sử dụng chế độ tính toán thủ công trong Excel và phiên bản Excel trên Windows." ông viết trên trang web của mình.

Tải về "Spreadsheets-are-all-you-need" tại đây.


Bình Minh

Cùng chuyên mục

1 loại lá phơi khô là “thuốc kháng sinh tự nhiên”, còn dưỡng gan, hạ đường huyết hiệu quả

Chủ nhật, 24/11/2024 23:00
Loại lá này là vị thuốc rất hữu hiệu với sức khỏe con người.

Phát hiện 4 thực phẩm giúp kéo dài tuổi thọ, chống ung thư cực tốt: Việt Nam có nhiều

Chủ nhật, 24/11/2024 23:00
Tuân thủ chế độ ăn giàu dinh dưỡng đóng vai trò quan trọng giúp bảo vệ sức khỏe, phòng ngừa bệnh tật và kéo dài tuổi thọ.

Thiếu niên 12 tuổi tử vong thương tâm khi đi xe scooter, cảnh sát lập tức điều tra

Chủ nhật, 24/11/2024 22:27
Nạn nhân được đưa vào viện trong trạng thái nguy kịch và đã tử vong sau đó.

Là đàn ông, xem xong sitcom "Sex and the City", tôi nhận ra: Nếu 1 người cha học được 3 điều này thì gia đình lúc nào cũng êm ấm!

Chủ nhật, 24/11/2024 22:24
Bộ phim đã khiến tôi có cái nhìn sâu sắc về mối quan hệ gia đình!

Tây Bắc 1 con đường “độc đạo” xuyên qua núi rất ít người biết: Chỉ dài 500m, đã được công nhận kỷ lục

Chủ nhật, 24/11/2024 22:22
Con đường "độc đạo" này là một điểm đến lý thú dành cho những người yêu thích khám phá, ưa mạo hiểm.
     
Nổi bật trong ngày

NSƯT Hoài Linh vừa tới Mỹ đã tới nhà Hương Lan làm điều này

Chủ nhật, 24/11/2024 07:17
Các nghệ sĩ đều vui mừng khi gặp lại Hoài Linh, ôm hôn thắm thiết, thể hiện tình cảm bền chặt.

Drama hậu Arcane 2: Fan bức xúc chất vấn dồn dập, Riot buộc phải lên tiếng thừa nhận

Chủ nhật, 24/11/2024 10:35
Series Arcane 2 đang để lại nhiều tranh cãi sau khi kết thúc.

Con trai viết văn tả mẹ nhưng lại nói dối một chuyện to đùng, phụ huynh đọc xong vừa đau lòng vừa ân hận

Chủ nhật, 24/11/2024 13:01
Chỉ vì hành động này của người mẹ đã khiến con trai cảm thấy tự ti.

Người đàn ông nhiễm độc kim loại nặng, suy thận: “Thủ phạm” là thứ không ngờ tới

Chủ nhật, 24/11/2024 15:26
Người đàn ông Thanh Hóa đi khám do đau buốt vùng khớp háng và được chẩn đoán nhiễm độc kim loại nặng, suy thận.

Trung Quốc phát hiện "Vạn Lý trường thành" dưới lòng đất: Bí mật quân sự 700 năm chìm trong quên lãng

Chủ nhật, 24/11/2024 20:00
Một "Vạn Lý trường thành" có liên quan đến Tào Tháo đã được tìm thấy.
xe.nguoiduatin.vn