Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?

Thứ 6, 26/01/2024 19:55
Tìm hiểu về Google Imagen AI, mô hình AI chuyển văn bản thành hình ảnh của riêng Google.

Cuối năm 2021 đánh dấu sự thay đổi lớn của thế giới công nghệ với sự phát triển vũ bão của các công cụ AI như ChatGPT, Bing hay Google Bard. Và khoảng thời gian trước đó, chúng ta từng biết tới DALL-E hay Midjourney với khả năng tạo ra hình ảnh dựa vào văn bản được người dùng nhập vào, sự ra đời của chúng lập tức làm điên đảo cộng đồng các nhà thiết kế. Và Google cũng không đứng ngoài "cuộc chơi" này.

1.png

Imagen AI là một mô hình chuyển đổi văn bản thành hình ảnh do Google phát triển. Imagen AI tiếp tục làm dài thêm danh sách các trình tạo hình ảnh từ văn bản bằng AI (trí tuệ nhân tạo), danh sách trước đó có các cái tên mà bạn có thể đã biết như DALL-E 2, Dream by Wombo và Midjourney. Tất cả chúng đều có thể khả năng tạo ra những hình ảnh tuyệt vời từ mô tả văn bản.

Google's Imagen 2 là gì?

Đến thời điểm hiện tại, Google đã cập nhật Imagen AI lên phiên bản 2.0 (Imagen 2) với rất nhiều cải tiến. Ngay cả khi bạn không phải là nhà phát triển hay doanh nghiệp, Imagen 2 rất đáng để thử - nó miễn phí bằng cách sử dụng Google Cloud.

Imagen 2 đã có một bước tiến vượt bậc so với phiên bản tiền nhiệm (Imagen) và cung cấp một trình tạo hình ảnh AI đầy đủ chức năng, có thể tạo ra các kết quả đầu ra mang tính nghệ thuật và chân thực. Nó được lưu trữ trong bộ công cụ Vertex AI của Google mà bạn có thể truy cập bằng tài khoản Google Cloud.

Để so sánh, phiên bản đầu tiên của Imagen, ra mắt từ tháng 5 năm 2022, có bản phát hành beta giới hạn thông qua ứng dụng có tên AI Test Kitchen. Người dùng chỉ có thể thử tạo ra cảnh quan thành phố hoặc các nhân vật trông giống như bước ra từ một bộ phim hoạt hình Pixar.

2.png

Imagen 2 tự hào có các tính năng như Inpainting và Outpainting, cho phép bạn thêm nội dung vào hình ảnh được tạo hoặc mở rộng hình ảnh ra ngoài đường viền. Đây là một tính năng mà DALL-E 2 cũng có, nhưng điều làm nên sự khác biệt của Imagen là tùy chọn sử dụng hình ảnh tham chiếu khi tạo hình ảnh.

Nếu bạn đang tìm kiếm một công cụ biến văn bản thành hình ảnh có thể giải quyết vấn đề về bàn tay do AI tạo ra thì bạn nên khám phá các khả năng của Imagen 2. Kết quả vẫn chưa hoàn hảo nhưng đó là khía cạnh mà Google đặc biệt chú ý khi phát triển công cụ.

Cách để truy cập và trải nghiệm Google's Imagen 2

Imagen 2 hướng đến các nhà phát triển và doanh nghiệp, nhưng nếu là cá nhân, bạn vẫn có thể dùng thử bằng cách đăng ký cho mình một tài khoản Google Cloud miễn phí như sau:

Bước 1: Truy cập vào trang web Google Cloud qua địa chỉ "cloud.google.com" và nhấn vào Start free.

Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 3.

Bước 2: Nhập các thông tin cơ bản về tài khoản Google hiện tại của bạn theo yêu cầu.

Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 4.

Bạn sẽ cần thêm thẻ tín dụng để thanh toán nhưng bạn không cần phải lo lắng về các khoản phí trong tương lai. Google tuyên bố rõ ràng rằng bạn sẽ không tự động bị tính phí sau khi thời gian dùng thử miễn phí kết thúc.

Bước 3: Sau khi đã tạo xong tài khoản Google Cloud miễn phí, bạn hãy nhấn vào menu mở rộng ở trang chủ Google Cloud và nhấn vào Vertex AI Vision.

Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 5.

Bước 4: Trang Vertex AI Vision mở ra, bạn nhấn tiếp vào "Studio".

Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 6.

Bước 5: Tiếp tục nhấn vào Enable ở Vision AI API.

Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 7.

Bước 6: Tiến hành tạo một ứng dụng trống mới.

Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 8.

Bước 7: Sau khi đã hoàn tất, bạn hãy nhấn vào Vision Powered by Image.

Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 9.

Bước 8: Việc sử dụng Imagen 2 cần được Google phê duyệt, quá trình này có thể mất ít ngày.

Google Imagen AI là gì? Làm thế nào để truy cập và sử dụng?- Ảnh 10.

Kết

Phía sau hậu trường, Imagen được đào tạo bằng cách sử dụng bộ dữ liệu có sẵn công khai có tên LAION-400M, kết hợp với các bộ dữ liệu nội bộ. Không phải tất cả các công ty AI đều chọn công khai thông tin này; một ví dụ là DALL-E 2.

Việc sử dụng các bộ dữ liệu cũng đã trở thành một chủ đề gây tranh cãi, một phần do hoạt động thu thập hàng triệu hình ảnh từ Internet. Đặc biệt, các nghệ sĩ đã chỉ trích những công ty AI vì không nhận được sự đồng ý của chủ sở hữu hình ảnh hoặc tác phẩm nghệ thuật trước khi sử dụng nó để đào tạo các mô hình AI của mình.

Nếu lo ngại về hình ảnh của mình, bạn có thể tìm hiểu xem hình ảnh của mình có được sử dụng để đào tạo mô hình AI hay không và chọn không tham gia.

Phạm Thái Học

Cùng chuyên mục

Thỉnh kinh nhẹ nhàng, nhận ngàn quà xịn cùng Tây Du Béo VNG

Thứ 7, 27/07/2024 07:53
Tây Du Béo VNG sẽ một lần nữa mang ký ức về hành trình thỉnh kinh của thầy trò Đường Tam Tạng trở lại dưới góc nhìn hài hước, vui nhộn và không thiếu những phần quà hấp dẫn chờ đón game thủ.

Vụ cô dâu chú rể đột ngột huỷ lễ cưới khi toàn bộ khách mời đã có mặt, vẫn ăn tiệc: Cần mừng tiền hay không?

Thứ 7, 27/07/2024 07:50
Quả thực đám cưới nói huỷ là huỷ nhưng quà cưới của khách mời cũng cần được làm rõ.

HAGL Agrico bị hủy niêm yết bắt buộc, tỷ Trần Bá Dương trấn an cổ đông: "Dù xuống UPCoM, nếu làm tốt giá vẫn có thể đi lên"

Thứ 7, 27/07/2024 07:43
Sở Giao dịch Chứng khoán Thành phố Hồ Chí Minh vừa ra thông báo về việc hủy niêm yết bắt buộc đối với cổ phiếu của CTCP Nông nghiệp Quốc tế Hoàng Anh Gia Lai (HAGL Agrico, mã HNG) hôm 26/7.

Vừa công bố lợi nhuận kỷ lục, Xây dựng Hoà Bình nhận tin dữ: Huỷ niêm yết bắt buộc trên sàn chứng khoán

Thứ 7, 27/07/2024 07:34
Lỗ luỹ kế vượt quá vốn điều lệ vào thời điểm 31/12/2023 khiến cổ phiếu HBC của Xây dựng Hoà Bình bị huỷ niêm yết.

Nissan Patrol 2025 chốt ra mắt: Sẽ lột xác từ ngoài vào trong, đấu Land Cruiser bằng động cơ khủng

Thứ 7, 27/07/2024 07:34
Nissan Patrol hứa hẹn sẽ là dòng SUV Nissan được nhắc tới rất nhiều trong thời gian tới đây khi thương hiệu chủ quản đặt mục tiêu cực cao cho xe.
     
Nổi bật trong ngày

Đánh bom ở Moscow: Hé lộ "dấu vết Ukraine" và danh tính nghi phạm – Hình ảnh sĩ quan Nga gây sốt sau vụ nổ

Thứ 6, 26/07/2024 06:45
Các tình tiết mới về vụ đánh bom ở Moscow nhằm vào xe của một sĩ quan Bộ Tổng tham mưu Nga đã được công bố. Đáng lưu ý, khả năng nghi phạm trong vụ này không hành động một mình.

Kia K4 lộ kiểu dáng mới: Thực dụng hơn nhờ cốp to nhưng về Việt Nam dễ kén khách

Thứ 6, 26/07/2024 08:54
Kia có thể sắp mở rộng thị trường của K4 với mục tiêu cạnh tranh Volkswagen Golf, Toyota Corolla hay Peugeot 308.

Từng thông báo ngừng phát hành, tựa game này bất ngờ “quay xe” mở cửa trở lại sau khi bị cộng đồng lên án nặng nề

Thứ 6, 26/07/2024 10:37
Nước đi có “1-0-2” của NPH đang khiến tựa game này thành tâm điểm chú ý.

Cây điều lớn nhất thế giới có diện tích hơn 8.000 mét vuông

Thứ 6, 26/07/2024 11:32
Cây điều Pirangi ở Rio Grande do Norte, Brazil, được coi là cây điều lớn nhất thế giới với chu vi khoảng 500 mét và diện tích bao phủ 8.400 mét vuông. Cây khổng lồ này không chỉ là một biểu tượng tự nhiên mà còn là một điểm thu hút du lịch quan trọng của khu vực.

Rộ tin đồn tuyển Việt Nam thay đổi lớn, sẽ có HLV mới sau thất bại cay đắng

Thứ 6, 26/07/2024 13:44
Bị loại ngay từ vòng bảng giải U19 Đông Nam Á, U19 Việt Nam được cho là sắp có thay đổi ở vị trí "lái trưởng".
xe.nguoiduatin.vn