Sợ kế toán sai một li

Sợ kế toán sai một li "đi... tù một dặm", lập trình viên tự code ứng dụng AI đọc hóa đơn thay mình

Thứ 3, 24/03/2026 17:00
Dự án mã nguồn mở cho phép chụp ảnh hóa đơn rồi để LLM trích xuất dữ liệu, phân loại chi phí, quy đổi hơn 170 loại tiền tệ - toàn bộ chạy trên máy chủ cá nhân.

"Kế toán - nghề dễ đi tù nhất" là câu đùa đã trở thành meme kinh điển trên mạng xã hội Việt Nam, đặc biệt phổ biến trên TikTok và các hội nhóm tài chính. Câu nói phản ánh nỗi ám ảnh có thật: sai sót trong sổ sách, khai man chứng từ hay ghi nhận không đúng quy định đều có thể dẫn đến hậu quả pháp lý nghiêm trọng theo luật kế toán Việt Nam. Với freelancer và doanh nghiệp nhỏ - những người thường tự làm sổ sách mà không có chuyên viên kế toán riêng - rủi ro sai sót càng cao hơn khi phải xử lý hàng trăm hóa đơn mỗi năm bằng tay.

Vasily Zubarev, lập trình viên gốc Siberia hiện sống tại Berlin (Đức), cũng rơi vào tình huống tương tự. Là freelancer, mỗi năm đến mùa thuế anh phải ngồi cả tuần phân loại đống hóa đơn tích lũy từ đầu năm. Zubarev cho biết đã thử nhiều phần mềm kế toán qua nhiều năm nhưng hầu hết không phù hợp với workflow cá nhân, hoặc tính phí hàng tháng quá cao. Giải pháp của anh: tự viết một ứng dụng dùng mô hình ngôn ngữ lớn (LLM) để đọc và phân loại hóa đơn tự động, rồi phát hành mã nguồn mở dưới giấy phép MIT cho bất kỳ ai muốn dùng.

Ứng dụng này có tên TaxHacker, hoạt động theo quy trình khá đơn giản: người dùng upload ảnh hóa đơn, receipt hoặc file PDF, sau đó hệ thống gửi tài liệu qua LLM đa phương thức (hỗ trợ OpenAI, Google Gemini hoặc Mistral) để nhận diện nội dung, trích xuất ngày tháng, số tiền, tên nhà cung cấp, danh sách sản phẩm, thuế, rồi tự động phân loại và lưu vào database dạng bảng tính. Ứng dụng xử lý được nhiều loại tài liệu: hóa đơn cửa hàng, bill nhà hàng, sao kê ngân hàng, thậm chí hóa đơn viết tay bằng bất kỳ ngôn ngữ nào. Có thể tách từng item trong một invoice thành các transaction riêng biệt.

Tuy vậy, khả năng OCR bằng AI không phải điều mới lạ. Điểm đáng chú ý hơn của dự án nằm ở triết lý thiết kế: toàn bộ prompt AI đều mở và cho phép chỉnh sửa. Người dùng tạo được custom fields không giới hạn, mỗi field đi kèm một prompt riêng để AI biết cần trích xuất thông tin gì. System prompt chung cũng sửa được ngay trong settings. Zubarev giải thích lý do: các phần mềm kế toán anh từng dùng đều ép người dùng vào khuôn mẫu cố định, với những trường dữ liệu bắt buộc không liên quan - một app thậm chí yêu cầu nhập email và "State" cho mỗi giao dịch đơn lẻ.

Về hỗ trợ tiền tệ, ứng dụng tự nhận diện loại tiền trong tài liệu và quy đổi theo tỷ giá lịch sử tại ngày giao dịch thực tế, hỗ trợ hơn 170 loại tiền tệ thế giới và 14 loại tiền mã hóa phổ biến gồm BTC, ETH, LTC, DOT. Tính năng này phục vụ nhóm freelancer nhận thanh toán từ nhiều quốc gia hoặc bằng crypto.

Về triển khai, ứng dụng chạy trên nền Next.js 15+ với PostgreSQL 17+, deploy bằng Docker Compose gồm 2 container. Toàn bộ dữ liệu lưu trên máy chủ của người dùng. Ngoài ra có full-text search trong nội dung tài liệu đã nhận diện, filter nâng cao theo nhiều tiêu chí, export CSV kèm file đính kèm, và thao tác hàng loạt.

Cần nhấn mạnh một số hạn chế. Dự án vẫn đang trong giai đoạn phát triển sớm, tác giả ghi rõ trên trang GitHub rằng người dùng tự chịu rủi ro khi sử dụng. Ứng dụng không có invoicing, payroll hay hệ thống sổ kép - bản chất là expense tracker kết hợp document analyzer, không phải phần mềm kế toán chuyên nghiệp. Chưa có tính năng cộng tác nhiều người dùng đầy đủ, chưa có mobile app chính thức, và vì phụ thuộc API từ OpenAI, Gemini hoặc Mistral nên vẫn phát sinh chi phí sử dụng AI (hỗ trợ LLM local đang nằm trong lộ trình). Quy mô cộng đồng hiện tại cũng còn nhỏ, khoảng 250 stars trên GitHub.

Zubarev cho biết đã dùng ứng dụng của mình xử lý hơn 200 hóa đơn cho năm 2024. Lộ trình tiếp theo gồm tự động tạo báo cáo VAT theo quý, nhắc nhở deadline thuế, đánh dấu giao dịch thiếu dữ liệu, và cho phép phân tích lại hàng loạt khi thay đổi prompt. Mã nguồn phát hành miễn phí dưới giấy phép MIT, dành cho ai biết dùng Docker và muốn tự kiểm soát dữ liệu tài chính của mình - dù "chị kế toán" vẫn là người đáng tin cậy nhất mà không AI nào thay thế được.

Thế Duyệt

Cùng chuyên mục

Cựu huyền thoại SKT T1 đã chốt luôn kết quả ngay từ khâu cấm chọn của đội nhà

Thứ 7, 18/04/2026 03:01
Cựu huyền thoại của SKT T1 và hiện đang làm streamer của đội đã chốt luôn kết quả từ khâu cấm chọn.

Lần đầu của lò Hà Nội FC và “trái ngọt” cha con bầu Hiển mang lại cho bóng đá Việt Nam

Thứ 7, 18/04/2026 00:25
Chức vô địch quốc gia của lứa U15 tiếp nối thêm bề dày thành tích cho lò đào tạo Hà Nội FC, đồng thời thêm một lần nữa khẳng định hướng đi đúng đắn của cha con bầu Hiển.

DJI Osmo Pocket 4 vs Osmo Pocket 3: Tất cả những nâng cấp đáng chú ý trên thế hệ mới

Thứ 6, 17/04/2026 23:09
DJI Osmo Pocket 4 mang đến cảm biến 1-inch 37MP, quay chậm 4K/240fps, bộ nhớ trong 107GB cùng hàng loạt cải tiến từ phần cứng đến phần mềm, hướng tới quy trình làm việc chuyên nghiệp hơn hẳn so với Pocket 3.

Insta360 hé lộ Luna Ultra: zoom quang 6x, thiết kế tách rời, tiện thể "đá xoáy" màn ra mắt mờ nhạt của Osmo Pocket 4

Thứ 6, 17/04/2026 22:50
Ngay sau khi DJI ra mắt Osmo Pocket 4 và hé lộ bản Osmo Pocket 4P, đối thủ Insta360 đã nhanh chóng phản pháo bằng loạt rò rỉ về mẫu gimbal camera Luna Ultra với khả năng zoom quang học ấn tượng và thiết kế module hoàn toàn mới.

Liệu 10 năm nữa, các hãng điện thoại bây giờ có còn tồn tại?

Thứ 6, 17/04/2026 22:40
Tôi đặt cùng một câu hỏi cho ChatGPT, Gemini và Claude, và cả ba chatbot đều đồng ý một điều: không hãng smartphone nào, dù lớn đến đâu, được đảm bảo chắc chắn sẽ trụ vững trong vòng 10 năm tới.
     
Nổi bật trong ngày

Vẫn dùng chiêu quen thuộc, kẻ gian có thể chiếm quyền kiểm soát Zalo, người dùng cần cẩn thận

Thứ 6, 17/04/2026 13:15
Gửi link giả mạo, dụ dỗ người dùng nhấn vào rồi đăng nhập tài khoản - thủ đoạn không mới nhưng đến nay vẫn khiến rất nhiều người mắc bẫy và mất quyền kiểm soát Zalo.

Có một cách xanh hơn cả dây chuyền tái chế tỷ USD của Apple, và Việt Nam đang âm thầm làm điều đó

Thứ 6, 17/04/2026 12:00
Báo cáo môi trường 2026 của Apple đầy những con số ấn tượng, nhưng một chỉ số quan trọng hơn lại không có trong đó: tổng thời gian sử dụng thực tế của mỗi chiếc máy sau khi rời tay Apple.

Sau trận thua sốc, Indonesia chờ đại chiến với Việt Nam, báo chí xứ Vạn đảo mơ về tỷ số khó tin

Thứ 6, 17/04/2026 16:43
Trước trận quyết định gặp U17 Việt Nam, truyền thông xứ Vạn đảo vẫn nuôi hy vọng tạo nên cú lội ngược dòng với một kịch bản tỷ số đầy tham vọng.

Đã mắt với phim Việt lắm gái xinh nhất trên đời: 1m2 có 3 nàng hậu, netizen tranh cãi ai là người đẹp nhất

Thứ 6, 17/04/2026 08:00
Phim có nội dung mới mẻ cuốn hút, đặc biệt thỏa mãn phần nhìn của khán giả với dàn diễn viên đẹp, chân dài tràn màn hình.

Campuchia chính thức bị loại sớm, tuyển Việt Nam gián tiếp hưởng lợi

Thứ 6, 17/04/2026 17:51
Kết quả ở lượt cuối bảng C càng làm tăng cơ hội để U17 Việt Nam vào bán kết giải U17 Đông Nam Á.
xe.nguoiduatin.vn