AI Genie, câu trả lời của Google cho Sora: AI tự tạo game 2D với lời nhắc chỉ bằng một hình ảnh duy nhất

Thứ 4, 28/02/2024 19:59
Tuy nhiên hiện tại Genie vẫn đang trong quá trình phát triển tiếp và chưa sẵn sàng ra mắt với công chúng.

AI tạo sinh đang phát triển với tốc độ chóng mặt so với tưởng tượng của người dùng, khi đang dần tiến tới việc xóa nhòa ranh giới giữa thực tế và trí tưởng tượng. Vài ngày trước, hãng OpenAI vừa giới thiệu mô hình AI mới có tên Sora, giúp tạo ra các đoạn video ngắn từ văn bản. Và giờ đây là câu trả lời của đối thủ Google khi công bố tài liệu nghiên cứu về mô hình AI có tên Genie – có khả năng tạo ra các trò chơi điện tử 2D từ lời nhắc văn bản và một hình ảnh duy nhất.

Tuy nhiên, hiện tại Genie vẫn đang được phát triển trong phòng nghiên cứu và chưa được công bố trên thị trường.

Được phát triển bởi nhóm Open-Endedness thuộc công ty Google DeepMind, dự án nghiên cứu đột phá này hứa hẹn tiềm năng to lớn cho tương lai của giải trí, phát triển trò chơi và thậm chí cả lĩnh vực robot. Google cho biết Genie là "mô hình thế giới có thể điều khiển" được huấn luyện trên bộ dữ liệu khổng lồ gồm 200.000 giờ video chưa được gắn nhãn, chủ yếu là các trò chơi nền tảng 2D xuất hiện trên internet.

Clip giới thiệu Genie do Tim Rocktäschel - Team Lead của Open-Endedness thuộc Google DeepMind - đăng tải trên tài khoản X của mình

Khác với các mô hình AI truyền thống thường yêu cầu hướng dẫn chi tiết và dữ liệu được dán nhãn, Genie học hỏi bằng cách quan sát các hành động và tương tác trong các video này, cho phép nó tạo ra trò chơi 2D từ một mô tả đơn giản bằng văn bản hoặc hình ảnh.

Trông có vẻ giống như một phép màu nào đó, nhưng theo giải thích trong tài liệu nghiên cứu về Genie được Google DeepMind quá trình vận hành bên trong lại tương đối phức tạp:

Genie bao gồm ba thành phần cốt lõi:

- Token hóa Video (Video Tokenizer): Hãy tưởng tượng Genie như một đầu bếp lành nghề đang chuẩn bị một món ăn phức tạp. Giống như cách đầu bếp phân tách nguyên liệu thành các phần nhỏ hơn để dễ dàng thao tác, công đoạn Token hóa Video xử lý khối dữ liệu video khổng lồ thành các đơn vị nhỏ gọn được gọi là "token". Các token này đóng vai trò như những khối xây dựng cơ bản giúp Genie hiểu thế giới hình ảnh.

AI Genie, câu trả lời của Google cho Sora: AI tự tạo game 2D với lời nhắc chỉ bằng một hình ảnh duy nhất- Ảnh 1.
AI Genie, câu trả lời của Google cho Sora: AI tự tạo game 2D với lời nhắc chỉ bằng một hình ảnh duy nhất- Ảnh 2.

Chỉ bằng một hình ảnh tĩnh duy nhất, AI Genie có thể tạo ra một tựa game 2D đơn giản như trên

- Mô hình Hành động tiềm tàng (Latent Action Model): Ở bước thứ hai, sau khi "chặt nhỏ" dữ liệu video thành các token, Mô hình Hành động Latent sẽ đảm nhận quá trình tiếp theo. Giống như một chuyên gia ẩm thực dày dạn kinh nghiệm, nó tỉ mỉ phân tích sự chuyển đổi giữa các khung hình liên tiếp trong video. Quá trình phân tích này cho phép nó xác định tám hành động cơ bản - "gia vị" thiết yếu của Genie. Các hành động này có thể bao gồm nhảy, chạy, tương tác với các vật thể trong môi trường trò chơi.

AI Genie, câu trả lời của Google cho Sora: AI tự tạo game 2D với lời nhắc chỉ bằng một hình ảnh duy nhất- Ảnh 3.
AI Genie, câu trả lời của Google cho Sora: AI tự tạo game 2D với lời nhắc chỉ bằng một hình ảnh duy nhất- Ảnh 4.

Tuy nhiên chất lượng hình ảnh vẫn rất thô sơ và nội dung game còn khá đơn giản

- Mô hình Động lực học (Dynamics Model): Cuối cùng là quá trình của Mô hình Động lực học – quá trình kết hợp mọi thứ lại với nhau. Tương tự như cách một đầu bếp dự đoán hương vị sẽ tương tác dựa trên các nguyên liệu được chọn, mô hình này dự đoán khung hình tiếp theo trong chuỗi video. Nó tính đến trạng thái hiện tại của thế giới trò chơi, bao gồm hành động của người chơi và tạo ra kết quả hình ảnh tiếp theo cho phù hợp. Quá trình dự đoán liên tục này cuối cùng tạo ra một trải nghiệm chơi game tương tác và hấp dẫn.

Tuy vậy hiện tại, Genie vẫn đang trong quá trình phát triển và vẫn còn nhiều giới hạn. Ví dụ chất lượng hiển thị vẫn rất kém khi tốc độ khung hình mới chỉ ở mức 1FPS, ảnh hưởng đến độ trung thực hình ảnh.

Cho dù vậy, tiềm năng của Genie cũng khiến nhiều người đặt câu hỏi về tương lai của các công việc liên quan đến việc phát triển game, đặc biệt các vị trí có vai trò thấp trong hoạt động phát triển game. Điều tương tự đang xảy đến với lĩnh vực làm phim khi mới đây, một tỷ phú tại Hollywood cũng cho biết đã sử dụng AI để chỉnh sửa gương mặt của mình trong phim, thay vì cần tới các chuyên gia trang điểm để hóa trang cho nhân vật.

Nguyễn Hải

Cùng chuyên mục

Indonesia "ngã ngựa" dù ăn gian; Thái Lan ôm hận bởi thế lực vượt trình Đông Nam Á?

Thứ 7, 27/07/2024 07:31
Hôm nay, hai trận Bán kết giải U19 Đông Nam Á 2024 sẽ diễn ra giữa các cặp đấu vô cùng hấp dẫn.

Chuyên gia lo Nga-Trung lợi dụng 'tình hình mong manh' ở Nhà Trắng – Ông Trump: Họ nhìn Mỹ 'như trẻ con'

Thứ 7, 27/07/2024 07:25
Bài phát biểu của Tổng thống Mỹ Joe Biden tối 24/7 không nhận được nhiều phản ứng từ các nhà lãnh đạo nước ngoài, nhưng Trung Quốc và Nga đã gây ra một sự cố phòng không như một dự báo về những gì có thể xảy ra trong những tháng tới.

Bị hỏi thiếu tế nhị về bé Bôm khi đi siêu thị, Quốc Tuấn phản ứng ra sao?

Thứ 7, 27/07/2024 07:25
"Có người hỏi cháu bị làm sao vậy. Tôi luôn trả lời rằng cháu không sao hết, bố cháu sẽ chỉnh hình lại cho cháu, không vấn đề gì hết" – diễn viên Quốc Tuấn chia sẻ.

Hàng loạt các sự cố bảo mật của VNDirect, PVOil, VNPOST cảnh báo việc đánh cắp và lộ lọt thông tin dữ liệu cá nhân: Đâu là giải pháp cho doanh nghiệp?

Thứ 7, 27/07/2024 07:22
Tình trạng mua bán dữ liệu cá nhân đang diễn ra phức tạp ở khắp nơi trên thế giới cũng như tại Việt Nam. Thực tế đó đòi hỏi các tổ chức, doanh nghiệp phải chú trọng, tăng cường bảo đảm an toàn thông tin phía người dùng hệ thống.

Cô gái thu nhập 100 triệu/tháng, chỉ tiêu 5 triệu/tháng, 27 tuổi mua nhà 3 tỉ và đặc biệt “tự tin trong hôn nhân”: Tất cả là nhờ TIẾT KIỆM!

Thứ 7, 27/07/2024 07:22
“Ưu điểm của việc tiết kiệm và có tài sản cố định khiến cho cuộc sống mình tự tin hẳn trong hôn nhân”.
     
Nổi bật trong ngày

Đánh bom ở Moscow: Hé lộ "dấu vết Ukraine" và danh tính nghi phạm – Hình ảnh sĩ quan Nga gây sốt sau vụ nổ

Thứ 6, 26/07/2024 06:45
Các tình tiết mới về vụ đánh bom ở Moscow nhằm vào xe của một sĩ quan Bộ Tổng tham mưu Nga đã được công bố. Đáng lưu ý, khả năng nghi phạm trong vụ này không hành động một mình.

Kia K4 lộ kiểu dáng mới: Thực dụng hơn nhờ cốp to nhưng về Việt Nam dễ kén khách

Thứ 6, 26/07/2024 08:54
Kia có thể sắp mở rộng thị trường của K4 với mục tiêu cạnh tranh Volkswagen Golf, Toyota Corolla hay Peugeot 308.

Từng thông báo ngừng phát hành, tựa game này bất ngờ “quay xe” mở cửa trở lại sau khi bị cộng đồng lên án nặng nề

Thứ 6, 26/07/2024 10:37
Nước đi có “1-0-2” của NPH đang khiến tựa game này thành tâm điểm chú ý.

Cây điều lớn nhất thế giới có diện tích hơn 8.000 mét vuông

Thứ 6, 26/07/2024 11:32
Cây điều Pirangi ở Rio Grande do Norte, Brazil, được coi là cây điều lớn nhất thế giới với chu vi khoảng 500 mét và diện tích bao phủ 8.400 mét vuông. Cây khổng lồ này không chỉ là một biểu tượng tự nhiên mà còn là một điểm thu hút du lịch quan trọng của khu vực.

Rộ tin đồn tuyển Việt Nam thay đổi lớn, sẽ có HLV mới sau thất bại cay đắng

Thứ 6, 26/07/2024 13:44
Bị loại ngay từ vòng bảng giải U19 Đông Nam Á, U19 Việt Nam được cho là sắp có thay đổi ở vị trí "lái trưởng".
xe.nguoiduatin.vn