Meta làm nóng cuộc chạy đua AI của Big Tech với mô hình ngôn ngữ mới LLaMA

Cuộc chiến công khai để thống trị không gian công nghệ AI đã bắt đầu vào cuối năm ngoái với việc ra mắt ChatGPT của OpenAI do Microsoft hậu thuẫn. Điều này cũng thúc đẩy các đối thủ nặng ký trong lĩnh vực công nghệ từ Alphabet Inc đến Baidu Inc của Trung Quốc.

Theo các thông tin mới nhất, "gã khổng lồ" mạng xã hội sẽ có công cụ mới để cạnh tranh là Meta's LLaMA, viết tắt của Large Language Model Meta AI. Sản phẩm sẽ được cung cấp theo giấy phép phi thương mại cho các nhà nghiên cứu và các tổ chức liên kết với chính phủ, xã hội dân sự...

images — Meta làm nóng cuộc chạy đua AI của Big Tech với mô hình ngôn ngữ mới LLaMA.

Các mô hình ngôn ngữ lớn khai thác một lượng lớn văn bản để tóm tắt thông tin và tạo nội dung. Chẳng hạn, chúng có thể trả lời các câu hỏi bằng những câu có thể đọc như thể được viết bởi con người.

Mô hình mà Meta cho biết yêu cầu sức mạnh tính toán "ít hơn nhiều" so với các dịch vụ trước đó, được đào tạo trên 20 ngôn ngữ, tập trung vào những ngôn ngữ có bảng chữ cái Latinh và Cyrillic.

Gil Luria, nhà phân tích phần mềm cao cấp tại DA Davidson cho biết: “Thông báo của Meta ngày hôm nay dường như là một bước thử nghiệm khả năng AI tổng quát của họ để họ có thể triển khai chúng vào các sản phẩm của mình trong tương lai”.

"AI sáng tạo là một ứng dụng mới của AI mà Meta có ít kinh nghiệm hơn, nhưng rõ ràng là rất quan trọng đối với tương lai kinh doanh của họ."

AI đã nổi lên như một điểm sáng cho các khoản đầu tư vào ngành công nghệ, ngành mà tốc độ tăng trưởng chậm lại đã dẫn đến tình trạng sa thải nhân công trên diện rộng và cắt giảm các hoạt động đặt cược thử nghiệm.

Meta cho biết LLaMA có thể vượt trội so với các đối thủ kiểm tra nhiều tham số hoặc biến số hơn mà thuật toán tính đến.

Cụ thể, nó cho biết một phiên bản LLaMA với 13 tỷ tham số có thể hoạt động tốt hơn GPT-3, phiên bản tiền thân gần đây của mô hình mà ChatGPT được xây dựng.

Nó mô tả mô hình LLaMA 65 tỷ tham số của mình là "cạnh tranh" với Chinchilla70B và PaLM-540B của Google, thậm chí còn lớn hơn mô hình mà Google đã sử dụng để giới thiệu công cụ tìm kiếm hỗ trợ trò chuyện Bard của mình.

Người phát ngôn của Meta cho rằng hiệu suất đạt được là nhờ số lượng lớn dữ liệu "sạch hơn" và "cải tiến kiến trúc" trong mô hình giúp nâng cao tính ổn định của đào tạo.

Vào tháng 5 năm ngoái, Meta đã phát hành mô hình ngôn ngữ lớn OPT-175B, cũng nhằm vào các nhà nghiên cứu, tạo cơ sở cho một phiên bản mới của chatbot BlenderBot.

Sau đó, nó đã giới thiệu một mô hình có tên là Galactica, có thể viết các bài báo khoa học và giải các bài toán, nhưng đã nhanh chóng gỡ bỏ bản demo sau khi nó tạo ra các phản hồi sai.

Anh Nguyễn