Những ví dụ cho thấy VideoPoet của Google sẽ trở thành đối thủ cạnh tranh đáng gờm của Sora do OpenAI phát triển

Thứ 4, 20/03/2024 15:06
Người dùng sẽ sớm chứng kiến VideoPoet và những hậu bối của nó sản sinh ra những video chân thực đến kinh ngạc.
Những ví dụ cho thấy VideoPoet của Google sẽ trở thành đối thủ cạnh tranh đáng gờm của Sora do OpenAI phát triển- Ảnh 1.

Hoạt hóa bức tranh Mona Lisa từ hai hướng dẫn: "Một người phụ nữ quay ra nhìn về ống kính" và "Một người phụ nữ đang ngáp".

Khi làn sóng trí tuệ nhân tạo sinh chữ đang trên đà ổn định với những sản phẩm đang ngày một hoàn thiện, một làn sóng mới mang tên “mô hình AI sinh video” bắt đầu nở rộ. Tuy nhiên, những mô hình dạng này gặp vấn đề lớn trong việc sản sinh ra một loạt những chuyển động hợp lý trong mắt người xem.

Theo thời gian, những mô hình dạng này sẽ học hỏi được nhiều hơn, qua đó cho ra những sản phẩm chất lượng và chân thật hơn. Cái hay của chúng nằm tại quy trình ra sản phẩm khá đơn giản, chỉ cần khéo léo ra lệnh để AI sinh ra video hay các sản phẩm tương tự. Bên cạnh mô hình AI đương đối đa năng, có thể làm video từ câu lệnh, tạo video từ ảnh hay phong cách hóa video, v.v...

Hiện tại phần mềm Sora của OpenAI thu hút sự chú ý của dư luận khi công bố loạt loạt video sản sinh từ AI chân thực đến ngỡ ngàng, thế nhưng họ không đơn độc trên hành trình nghiên cứu trí tuệ nhân tạo. Google cũng sở hữu dự án tương tự của riêng mình có tên VideoPoet, đã đang phát triển được một thời gian và cũng có những sản phẩm rất ấn tượng.

Hướng dẫn: "Hai con gấu trúc chơi bài".

Video từ hướng dẫn: "Hai con gấu trúc chơi bài".

Video từ hướng dẫn: "Ngựa phi nước đại trên nền bức tranh Starry Night của van Gogh".

Video từ hướng dẫn: "Ngựa phi nước đại trên nền bức tranh Starry Night của van Gogh".

Theo khẳng định từ các nhà nghiên cứu của Google, hình ảnh đầu vào có thể được hoạt hóa để tạo ra chuyển động, VideoPoet cũng có thể tự điền nội dung thiếu (ví dụ như phục hồi video gốc) hay sản sinh thêm nội dung cho video. 

Còn trong tác vụ phong cách hóa, mô hình AI sử dụng video mô tả độ sâu và hiệu ứng quang học, vốn có thể phô diễn chuyển động, rồi vẽ thêm nội dung lên trên để tạo ra phong cách theo hướng dẫn của người dùng. Dưới đây là sản phẩm sau khi phong cách hóa một video cũng sinh ra từ mô hình AI của Google.

Những ví dụ cho thấy VideoPoet của Google sẽ trở thành đối thủ cạnh tranh đáng gờm của Sora do OpenAI phát triển- Ảnh 4.

Hướng dẫn của các video (từ trái sang phải): "Con wombat đeo kính râm ôm một quả bóng chuyền trên bãi biển"; "Gấu bông trượt băng trên một hồ nước đóng băng"; "Một con sư tử kim loại gầm lên trong ánh sáng của lò rèn".

Dựa trên 1 giây cuối cùng trong video, mô hình AI có thể tạo ra video dài hơn thông qua dự đoán nội dung có thể diễn ra trong giây tiếp theo. Lặp lại quá trình này, VideoPoet không chỉ có thể mở rộng video dễ dàng mà còn giữ nguyên dạng các đối tượng xuất hiện trong đoạn clip ngắn.

Video từ hướng dẫn: "Một nhà du hành vũ trụ bắt đầu nhảy trên Sao Hỏa. Rồi pháo hoa rực rỡ nổ từ đằng sau".

Video từ hướng dẫn: "Một nhà du hành vũ trụ bắt đầu nhảy trên Sao Hỏa. Rồi pháo hoa rực rỡ nổ từ đằng sau".

VideoPoet cũng có khả năng tạo ra âm thanh. Với các đoạn clip dài 2 giây, AI cố gắng dự đoán âm thanh mà không cần hướng dẫn bằng văn bản. Điều này cho phép tạo ra video và âm thanh từ một mẫu duy nhất.

Sản sinh âm thanh từ nội dung gấu bông đánh trống.

Sản sinh âm thanh từ nội dung mèo chơi piano.

Thông qua VideoPoet, Google chứng minh chất lượng cực kỳ cạnh tranh của các mô hình ngôn ngữ lớn, không chỉ sản sinh nội dung văn bản mà còn tạo video bắt mắt, chân thực.

Kết quả cho thấy tiềm năng hứa hẹn của các mô hình ngôn ngữ lớn trong lĩnh vực tạo video. Trong tương lai, những mô hình AI dạng này có thể sản sinh nội dung dựa trên nhiều hướng dẫn đầu vào, như dùng văn bản tạo ra âm thanh, tạo video từ câu nói, tự động mô tả video, và nhiều ứng dụng khác.

Kim

Cùng chuyên mục

Apple tham vọng ra mắt nhiều thiết bị gập, cạnh tranh với Samsung

Chủ nhật, 26/05/2024 18:06
Các thiết bị màn hình gập đầu tiên của Apple sẽ được giới thiệu trong giai đoạn cuối năm 2025, đầi 2026.

Game thủ LMHT vẽ “thuyết âm mưu” xung quanh vụ việc Vanguard của Riot gặp “biến căng”

Chủ nhật, 26/05/2024 17:35
Thay vì buông lời chỉ trích, nhiều game thủ LMHT lại quay sang cảm ơn Riot Games với “thuyết âm mưu” này.

Thực hư thông tin chìm phà chở khách ra đảo Cát Bà

Chủ nhật, 26/05/2024 17:33
Nguyên nhân của sự cố rò rỉ nước trên phà theo nhận định ban đầu có thể phà va vào vật cứng, bị bục sàn nên nước tràn vào.

Cô gái trẻ sốc vì phải chạy thận suốt đời: Bác sĩ nói do 1 thói quen tai hại kéo dài 10 năm

Chủ nhật, 26/05/2024 17:12
Bác sĩ cho biết đây là thói quen phổ biến, nhiều người mắc nhưng có thể gây tổn hại thận nghiêm trọng.

Nghi vấn Esports World Cup 2024 sẽ trở thành "MSI 2.0" khiến cộng đồng LMHT phản ứng dữ dội

Chủ nhật, 26/05/2024 17:10
Liệu sẽ có MSI 2.0 trên đất Ả Rập?
     
Nổi bật trong ngày

Bị hàng xóm lắp camera và dùng flycam theo dõi, cô gái tuyệt vọng cầu cứu truyền thông

Thứ 7, 25/05/2024 07:22
Từ lúc bị người hàng xóm theo dõi và làm phiền, cô gái đã phải sống trong sự bất tiện và thấp thỏm.

Chăm chồng ung thư phổi giai đoạn cuối, người phụ nữ Sơn La làm 1 điều khiến ai cũng xúc động

Thứ 7, 25/05/2024 10:05
Chồng mắc ung thư phổi giai đoạn cuối, người vợ làm một điều khiến ai biết chuyện cũng xúc động.

Bom tấn game mới của Marvel gặp "biến", bị tố copy quá nhiều từ một siêu phẩm lâu đời

Thứ 7, 25/05/2024 11:26
Không quá khó để các game thủ có thể chỉ ra những điểm giống nhau giữa dàn nhân vật của hai bom tấn này.

Trên tay Fujifilm X-T50: Nhỏ, nhẹ và vòng xoay giả lập màu phim khá 'vui vẻ'

Thứ 7, 25/05/2024 14:20
Đây có thể coi là dòng máy Fujifilm X cận cao cấp nằm dưới X-T5 với mức giá khởi điểm là 34.990.000 Đồng.

Vụ cháy Trung Kính: Cập nhật mới nhất về sức khỏe 2 vợ chồng 'cố thủ' trong nhà tắm

Thứ 7, 25/05/2024 18:10
Khi xảy ra vụ cháy Trung Kính, hai vợ chồng đã 'cố thủ' trong nhà tắm, chờ người tới cứu. Hiện 2 người đang điều trị tại Bệnh viện Bạch Mai.
xe.nguoiduatin.vn