OpenAI ra mắt công cụ AI sáng tạo video siêu thực

Trong khi Google vừa công bố Runway AI mới thì OpenAI ngay lập tức phản công bằng Sora - công cụ đầu tiên của hãng có khả năng chuyển văn bản thành video có thời lượng tối đa 1 phút. Sora không chỉ là một ứng dụng khác trong bộ công cụ AI mà dường như còn là biểu tượng cho tương lai của những nhà sáng tạo và công chúng, đặc biệt khi nó tốt hơn so với những video mờ, giật, méo và đôi khi đáng lo ngại mà Runway AI mang lại.

Theo từ tiếng Nhật, Sora có nghĩa là “bầu trời”. Nhóm đằng sau công nghệ này, bao gồm các nhà nghiên cứu Tim Brooks và Bill Peebles, được cho là đã chọn cái tên này vì nó “gợi lên ý tưởng về tiềm năng sáng tạo không giới hạn”.

OpenAI đã chia sẻ một số video clip được tạo ra bởi AI mới của họ và kết quả ít nhất phải nói là ngoạn mục, ví dụ nó dựa vào yêu cầu sáng tạo nội dung “Thành phố Tokyo đầy tuyết xinh đẹp đang sôi động. Máy ảnh di chuyển dọc theo con phố đông đúc của thành phố, theo chân một số người đang tận hưởng thời tiết tuyết rơi tuyệt đẹp và mua sắm tại các quầy hàng gần đó. Những cánh hoa anh đào xinh đẹp bay trong gió cùng những bông tuyết”. Theo yêu cầu, video được tạo thể hiện một con phố ở Tokyo và cho thấy rõ ràng rằng Sora đã học được cách các vật thể khớp với nhau trong không gian 3D. Sau đó, máy quay sẽ tập trung vào hiện trường để theo dõi một cặp đôi đi ngang qua một dãy cửa hàng.

Các video mà công cụ AI của OpenAI tạo ra thuyết phục hơn nhiều so với những gì các công cụ hiện có khác cung cấp, ngay cả đôi khi chúng có một số sai sót nhỏ. Ví dụ, một trong số đó là một người phụ nữ đang đi bộ trên phố, chẳng hạn như trong một số hình ảnh có thể nhận thấy rằng chân của cô không theo chuyển động một cách chính xác.

Hiện tại, Sora vẫn đang trong giai đoạn phát triển và do đó chưa có sẵn cho công chúng. Tuy nhiên, OpenAI đã chia sẻ công cụ này với một số học giả và nhà nghiên cứu khác, những người sẽ gửi nó cho “đội đỏ”, được hiểu là một nhóm nhỏ những người chịu trách nhiệm nghiên cứu mọi cách để tìm hiểu những mối nguy hiểm mà công nghệ đó mang lại.

Điều chắc chắn là OpenAI sẽ phải tìm cách đảm bảo video của họ không bị sử dụng cho thông tin sai lệch. Hồi đầu tháng, OpenAI đã công bố bổ sung hình mờ vào công cụ chuyển đổi văn bản thành hình ảnh DALL-E 3 của mình, nhưng cho biết chúng có thể “dễ dàng xóa bỏ”. Vì vậy, hy vọng công ty đang nghiên cứu một cách mới để đảm bảo có thể dễ dàng nhận dạng được các video giả mạo.

OpenAI cũng cung cấp quyền truy cập cho các nghệ sĩ thị giác, nhà thiết kế và nhà làm phim chọn lọc để đưa ra phản hồi. Công ty lưu ý rằng mô hình hiện tại có thể không mô phỏng chính xác tính chất vật lý của một cảnh phức tạp và có thể không giải thích chính xác một số trường hợp nguyên nhân và kết quả, đó là lý do tại sao công nghệ vẫn cần phải hoàn thiện trước khi được phổ biến rộng rãi hơn.

Thái An