Sora của OpenAI vừa chính thức ra mắt, Google đã tung đòn đáp trả đẳng cấp: Độ phân giải lên tới 4K, thời lượng lên tới 2 phút

Sora của OpenAI vừa chính thức ra mắt, Google đã tung đòn đáp trả đẳng cấp: Độ phân giải lên tới 4K, thời lượng lên tới 2 phút

Thứ 3, 17/12/2024 17:13
Với việc tăng cường độ phân giải công cụ của mình lên 4K, Google đang hướng tới một đối tượng người dùng khác hẳn Sora của OpenAI.

Không lâu sau khi OpenAI chính thức mở cửa Sora, công cụ AI tạo video, tới rộng rãi công chúng, Google DeepMind, bộ phận AI của tập đoàn Alphabet cũng công bố đòn đáp trả của mình, công cụ AI Veo 2 phiên bản mới, với nhiều ưu điểm vượt trội so với phiên bản đầu tiên cũng như với chính đối thủ Sora của OpenAI.

Công cụ mới này có khả năng tạo ra các video với độ phân giải lên tới 4K, trong khi phiên bản Veo đầu tiên chỉ hỗ trợ tối đa 1080p. Google tuyên bố đã cải tiến vật lý của các cảnh quay do Veo 2 tạo ra, cũng như nâng cao "khả năng điều khiển camera" (không có camera thực sự tham gia, nhưng người dùng có thể ra lệnh cho mô hình tạo ra các góc quay và cảnh quay cụ thể, từ cận cảnh đến quét ngang).

DeepMind cũng giới thiệu phiên bản cập nhật của mô hình chuyển văn bản thành hình ảnh Imagen 3, mặc dù các thay đổi như "hình ảnh cân bằng hơn về mặt tổng hợp" và cải thiện khả năng tuân thủ các phong cách nghệ thuật, rõ ràng là chưa đủ lớn để xứng đáng có một số phiên bản hoàn toàn mới. Imagen 3 lần đầu ra mắt vào tháng 8.

screenshot 2024 12 13 at 54452pm
Google Veo 2 được cập nhật với nhiều nâng cấp mới, vượt trội hơn so với phiên bản đầu cũng như đối thủ Sora

Bước nhảy vọt lên độ phân giải 4K của Veo 2 cho thấy DeepMind đang vượt trội so với các công cụ AI đối thủ trong lĩnh vực tạo video. OpenAI cuối cùng cũng phát hành công cụ tạo video Sora vào tuần trước, sau khi ra mắt vào tháng 2, nhưng đầu ra của Sora (cụ thể là phiên bản Sora Turbo hiện đã có sẵn cho người dùng ChatGPT Plus và Pro) vẫn bị giới hạn ở độ phân giải tối đa 1080p. Runway, có lẽ là công cụ tạo video AI phổ biến nhất hiện nay, chỉ có thể xuất video ở độ phân giải thấp hơn 720p.

wm14059786826video0 ezgifcom optimize
Thành quả của dòng lệnh trên

"Video độ phân giải thấp rất tuyệt vời cho thiết bị di động, nhưng các nhà sáng tạo muốn thấy tác phẩm của họ tỏa sáng trên màn hình lớn," Google cho biết trong bài thuyết trình về Veo 2. Các clip 4K của Veo 2 mặc định bị giới hạn trong 8 giây, nhưng có thể kéo dài tới 2 phút hoặc hơn, theo phát ngôn viên của Google. Các đoạn clip 1080p của Sora bị giới hạn ở 20 giây.

DeepMind tuyên bố rằng, khi so sánh Veo 2 với Sora Turbo, 59% người đánh giá đã ưu tiên dịch vụ của Google, với 27% lựa chọn Sora Turbo. Họ cũng tuyên bố chiến thắng tương tự trước Minimax và Movie Gen của Meta, với tỷ lệ ưu tiên Veo 2 chỉ giảm nhẹ xuống dưới 50% khi đối thủ là Kling v1.5, một dịch vụ từ công ty công nghệ Kuaishou của Trung Quốc.

Khi nói đến "sự tuân thủ lệnh" - tức là làm điều nó được yêu cầu - Veo 2 cũng được ưa chuộng với tỷ lệ tương tự, theo DeepMind. Họ cũng tuyên bố đã đạt được những bước tiến đáng kể trong việc chống lại các chi tiết "ảo giác", như ngón tay thừa, và trong việc thể hiện "sự hiểu biết tốt hơn về vật lý thế giới thực cũng như các nét tinh tế của chuyển động và biểu cảm của con người".

ezgif 5 2b83e53ea9
Các yếu tố vật lý dường như được tuân thủ tốt hơn trong Google Veo 2

Vấn đề vật lý là một trong những điều tiếp tục làm khó các công cụ tạo video. Ví dụ, Sora gặp khó khăn trong việc tạo ra các đoạn phim hợp lý về vận động viên thể dục dụng cụ và các chuyển động phức tạp của họ. Vẫn chưa rõ Veo 2 sẽ chứng tỏ tốt hơn bao nhiêu ở khía cạnh này.

Một số chuyên gia, như giáo sư Đại học Stanford và đồng sáng lập World Labs Fei-Fei Li, lập luận rằng các vấn đề như vật lý và sự tồn tại vĩnh viễn của vật thể chỉ có thể thực sự được giải quyết với các mô hình thế giới có "trí tuệ không gian" để hiểu và tạo ra môi trường 3D.

Google cũng giới thiệu mô hình thế giới Genie 2 của riêng mình vào đầu tháng này, nhưng tập trung vào việc tạo ra các môi trường có thể được sử dụng để đào tạo và đánh giá các "tác nhân" AI hoạt động trong môi trường ảo.

Đầu ra của các công cụ tạo hình ảnh và video càng hợp lý, thì nguy cơ chúng bị sử dụng cho các mục đích xấu càng cao. DeepMind áp dụng các hình mờ SynthID không nhìn thấy được vào các clip Veo 2, điều này sẽ khiến việc sử dụng chúng cho mục đích tuyên truyền chính trị khó khăn hơn, nếu mọi người kiểm tra video để tìm các dấu hiệu nguồn gốc AI.

screenshot 2024 12 13 at 65044pm
Công cụ tạo ảnh Imagen 3 cũng được Google nâng cấp trong lần này

Điều tương tự có thể không đúng với các ứng dụng gian lận thông thường hơn, nơi nạn nhân ít có khả năng kiểm tra tệp để tìm hình mờ vô hình. Trái ngược với điều này, OpenAI Sora nhúng một hoạt ảnh có thể nhìn thấy ở góc dưới bên phải của video. Sora cũng sử dụng giao thức hình mờ nguồn mở C2PA, một hệ thống thay thế cho SynthID (mặc dù Google cũng tham gia sáng kiến C2PA vào tháng 2).

Veo 2 hiện đang cung cấp năng lượng cho công cụ tạo VideoFX của Google Labs (có giới hạn độ phân giải 720p), trong khi phiên bản Imagen 3 đã sửa đổi hiện có thể được sử dụng trong công cụ ImageFX. VideoFX hiện chỉ đang ra mắt ở Hoa Kỳ, nhưng ImageFX có sẵn ở hơn 100 quốc gia.

Google DeepMind chưa tiết lộ dữ liệu nào được sử dụng để đào tạo Veo 2 hoặc phiên bản mới của Imagen 3, mặc dù trước đây họ đã gợi ý rằng các video YouTube (cả hai công ty đều thuộc Alphabet) bao gồm một phần dữ liệu đào tạo cho Veo ban đầu.

Nhiều nghệ sĩ, nhiếp ảnh gia, nhà sáng tạo và nhà làm phim lo ngại rằng các tác phẩm có bản quyền của họ đã được sử dụng để đào tạo các hệ thống như vậy mà không có sự đồng ý của họ. OpenAI từ chối tiết lộ dữ liệu nào được sử dụng để đào tạo Sora, nhưng tờ New York Times, dẫn nguồn quen thuộc với việc đào tạo của Sora, đã đưa tin rằng công ty đã sử dụng video từ dịch vụ YouTube của Google để đào tạo mô hình AI. 404 Media trước đây đã báo cáo rằng Runway dường như cũng đã sử dụng video YouTube để đào tạo Gen 3 Alpha.

Nguyễn Hải

Cùng chuyên mục

Khai tử Sora: Giờ OpenAI mới nhận ra, người dùng không cần AI rác, còn Anthropic đã đúng từ đầu

Thứ 5, 26/03/2026 13:15
Bài học thực sự của điều này không nằm ở con số, mà nằm ở chỗ OpenAI vừa học được điều Anthropic đã biết từ lâu

Đang dùng Galaxy S24 Ultra trở xuống? Có 5 lý do để bạn cân nhắc mua Galaxy S26 Ultra ngay và luôn

Thứ 5, 26/03/2026 12:10
Galaxy S26 Ultra đặt ra một câu hỏi với người dùng: Nếu cách bạn sử dụng điện thoại đã thay đổi, liệu chiếc máy bạn đang dùng có còn theo kịp hay không.

Tham vọng của Harry Potter bản truyền hình: Tái hiện loạt chi tiết bị bỏ quên, fan nguyên tác có lý do để chờ đợi

Thứ 5, 26/03/2026 11:32
Đây không phải là một dự án remake đơn thuần, mà là tham vọng xây dựng lại toàn bộ thế giới Harry Potter theo cách nghiêm túc và chỉn chu hơn.

Siêu Sale Sinh Nhật Lazada có loạt đồ điện tử nội địa Trung hay ho giảm đến nửa giá, anh em không nên bỏ qua

Thứ 5, 26/03/2026 11:00
Những sản phẩm dưới đây đến từ các gian hàng TMall chính hãng trên Lazada, tức hàng nội địa Trung Quốc chất lượng cao bán đúng giá thị trường nội địa, không qua tay trung gian. Dịp Siêu Sale Sinh Nhật Lazada năm nay, nhiều món đang giảm đến nửa giá.

"Siêu đội hình" Malaysia nhận án phạt nghiêm khắc từ AFC

Thứ 5, 26/03/2026 10:37
LĐBĐ châu Á (AFC) vừa công bố một loạt án phạt.
     
Nổi bật trong ngày

Mẹ đơn thân giàu nhất Vbiz ở biệt thự 20 tỷ, 40 tuổi tự sinh con, trẻ mãi không già suốt 15 năm

Thứ 4, 25/03/2026 02:36
Màn tái xuất của nữ diễn viên mới đây đã nhận về cơn mưa lời khen từ cộng đồng mạng.

HLV Kim Sang-sik: “Tôi sẽ dùng Hoàng Hên, Xuân Son đấu với ngôi sao Bangladesh từng đá Ngoại hạng Anh”

Thứ 4, 25/03/2026 10:24
Chia sẻ vào buổi họp báo trưa nay (25/3), HLV Kim Sang-sik hé lộ phương án sử dụng cả Hoàng Hên và Xuân Son ở trận gặp Bangladesh.

Các hoa hậu, nghệ sĩ lan tỏa tri thức và khát vọng tại Hành trình Từ Trái Tim

Thứ 4, 25/03/2026 16:56
Không chỉ là hoạt động trao tặng sách, chuỗi chương trình đã trở thành không gian kết nối tri thức, cảm hứng và khát vọng, nơi những câu chuyện truyền cảm hứng được chia sẻ, những giá trị nền tảng được khơi mở và lan tỏa mạnh mẽ đến thế hệ trẻ.

Sau 1 tuần đeo Xiaomi Watch 5: Gemini, Google Pay, cài nhiều app hay thật, nhưng hóa ra chế độ tiết kiệm pin mới là "chân ái"

Thứ 5, 26/03/2026 01:00
Xiaomi Watch 5 gây ấn tượng mạnh với pin silicon-carbon 930mAh và lời hứa 6 ngày dùng Wear OS đầy đủ. Nhưng sau một tuần đeo thực tế, tôi đã tìm ra cách dùng chiếc đồng hồ này hiệu quả hơn hẳn - dù nghe có vẻ ngược đời.

Siêu Sale Sinh Nhật Lazada có loạt đồ điện tử nội địa Trung hay ho giảm đến nửa giá, anh em không nên bỏ qua

Thứ 5, 26/03/2026 11:00
Những sản phẩm dưới đây đến từ các gian hàng TMall chính hãng trên Lazada, tức hàng nội địa Trung Quốc chất lượng cao bán đúng giá thị trường nội địa, không qua tay trung gian. Dịp Siêu Sale Sinh Nhật Lazada năm nay, nhiều món đang giảm đến nửa giá.
xe.nguoiduatin.vn