Bước tiến đầu tiên của Apple vào lĩnh vực AI tạo sinh: chỉnh sửa ảnh bằng ngôn ngữ đời thường thay vì phần mềm

Thứ 5, 08/02/2024 19:45
Việc dùng Photoshop để chỉnh sửa ảnh sắp đi vào dĩ vãng.

Các nhà nghiên cứu tại Apple vừa công bố một mô hình AI mã nguồn mở mới cho phép người chỉnh sửa hình ảnh bằng cách dùng ngôn ngữ tự nhiên để mô tả những thay đổi thay vì phải sử dụng phần mềm chỉnh sửa ảnh.

Được Apple phối hợp phát triển cùng với Đại học California, Santa Barbara, mô hình có tên MGIE này có khả năng cắt, thay đổi kích thước, lật hình, và thêm bộ lọc cho hình ảnh qua các câu lệnh văn bản.

Là tên viết tắt của "MLLM-Guided Image Editing" (Chỉnh sửa Ảnh Dưới Sự Hướng dẫn của Mô hình Ngôn ngữ Đa phương tiện), MGIE có thể được áp dụng cho cả các thao tác chỉnh sửa ảnh đơn giản lẫn phức tạp như thay đổi hình dạng cụ thể của các đối tượng trong ảnh hoặc làm cho chúng trở nên sáng hơn. Mô hình kết hợp hai khả năng sử dụng khác nhau của những mô hình ngôn ngữ đa phương tiện:

Bước tiến đầu tiên của Apple vào lĩnh vực AI tạo sinh: chỉnh sửa ảnh bằng ngôn ngữ đời thường thay vì phần mềm- Ảnh 1.

Đầu tiên, nó học cách giải thích các lệnh của người dùng. Sau đó, mô hình "tưởng tượng" xem việc chỉnh sửa sẽ trông như thế nào (ví dụ, yêu cầu bầu trời trong ảnh trở nên xanh hơn sẽ được hiểu là tăng độ sáng cho phần bầu trời trong ảnh).

Khi chỉnh sửa một bức ảnh với MGIE, người dùng chỉ cần gõ ra những gì họ muốn thay đổi về bức hình. Ví dụ để chỉnh sửa ảnh của một chiếc bánh pizza. Khi nhập lệnh "làm cho nó trở nên lành mạnh hơn" sẽ làm bức ảnh thêm rau củ bên trên. Một ví dụ khác là bức ảnh về những con hổ ở Sahara đang bị tối, nhưng sau khi yêu cầu mô hình "tăng thêm sự tương phản để mô phỏng việc thêm ánh sáng," bức ảnh trở nên sáng hơn.

Bước tiến đầu tiên của Apple vào lĩnh vực AI tạo sinh: chỉnh sửa ảnh bằng ngôn ngữ đời thường thay vì phần mềm- Ảnh 2.

Sự đổi mới này mở ra một kỷ nguyên mới trong lĩnh vực chỉnh sửa ảnh, giúp người dùng dễ dàng tạo ra những bức ảnh theo ý muốn mà không cần phải học cách sử dụng các công cụ phức tạp, góp phần làm cho công nghệ chỉnh sửa ảnh trở nên tiện lợi và dễ tiếp cận hơn bao giờ hết.

Các nhà nghiên cứu cho biết: "Thay vì lời chỉ dẫn ngắn gọn nhưng mơ hồ, MGIE nhận ra ý định rõ ràng có nhận thức về hình ảnh và dẫn đến việc chỉnh sửa ảnh hợp lý. Chúng tôi đã tiến hành nghiên cứu bao quát từ nhiều khía cạnh chỉnh sửa khác nhau và chứng minh rằng mô hình MGIE giúp cải thiện hiệu suất trong khi vẫn duy trì hiệu quả cạnh tranh. Chúng tôi cũng tin rằng framework chỉ dẫn cho MLLM có thể đóng góp cho nghiên cứu liên quan đến thị giác và ngôn ngữ trong tương lai."

Bước tiến đầu tiên của Apple vào lĩnh vực AI tạo sinh: chỉnh sửa ảnh bằng ngôn ngữ đời thường thay vì phần mềm- Ảnh 3.

Theo báo cáo của VentureBeat, Apple hiện đã đưa MGIE lên GitHub để tải về và cũng phát hành một bản web demo trên nền tảng Hugging Face Spaces. Công ty không tiết lộ kế hoạch của mình cho mô hình này ngoài mục đích nghiên cứu.

Hiện tại trên thế giới đã có nhiều mô hình AI hỗ trợ chỉnh sửa hoặc sản sinh hình ảnh, như DALL-E 3 của OpenAI, Midjourney, Stable Diffusion, … chúng đều có thể thực hiện các tác vụ chỉnh sửa hình ảnh thông qua các câu lệnh văn bản. Adobe, công ty tạo ra phần mềm chỉnh sửa ảnh Photoshop nổi tiếng, cũng có mô hình chỉnh sửa AI của riêng mình. Mô hình Firefly AI của họ cung cấp khả năng điền nội dung, sản sinh ra phông nền cho ảnh.

Không giống như Microsoft, Meta, hoặc Google, hiện Apple chưa phải là một tên tuổi lớn trong lĩnh vực AI tạo sinh, , nhưng CEO của Apple, Tim Cook, đã nói rằng công ty muốn thêm nhiều tính năng AI vào thiết bị của mình trong năm nay. Vào tháng 12, các nhà nghiên cứu của Apple đã phát hành một framework máy học mã nguồn mở có tên MLX để giúp việc huấn luyện các mô hình AI trên chip Apple Silicon trở nên dễ dàng hơn.

Nguyễn Hải

Cùng chuyên mục

Người dân tích trữ cho bão Yagi: Vì sao 2 loại rau củ giàu dinh dưỡng này bị ‘bỏ rơi’?

Chủ nhật, 08/09/2024 06:45
Hình ảnh 2 loại rau củ tại siêu thị bị "ngó lơ"trong khi các mặt hàng khác gần như “cháy hàng” không chỉ gây thắc mắc cho cộng đồng mạng mà còn đặt ra nhiều câu hỏi về tâm lý tiêu dùng và quan niệm ăn uống của người Việt trong những ngày thiên tai.

Chồng nạn nhân bị cây đè tử vong ở Hà Nội: "Tôi dặn vợ nếu mưa to quá thì mai hãy về"

Thứ 7, 07/09/2024 22:03
Khi được báo vợ và em trai gặp tai nạn, anh Linh vẫn mong là có sự nhầm lẫn. Nhưng khi tới bệnh viện, người chồng đau xót nhận tin vợ đã không qua khỏi.

Mang "bụng bia" vào sân, Rooney vẫn trình diễn tuyệt kỹ khiến các đàn em tại MU phải ngước nhìn

Thứ 7, 07/09/2024 21:54
Dù đã giải nghệ khá lâu, Rooney vẫn giữ được phẩm chất kỹ thuật đặc biệt.

Khi có gió to nên đóng hay mở cửa kính: Rất nhiều người đang hiểu sai

Thứ 7, 07/09/2024 21:34
Xử lý đúng sẽ giúp hạn chế được thiệt hại về tài sản trong nhà vào những ngày mưa bão đi kèm gió lớn.

Tìm ra mối liên hệ bất ngờ giữa tính cách và tuổi thọ: Người hướng nội hay hướng ngoại, ai có khả năng sống thọ hơn?

Thứ 7, 07/09/2024 21:00
Một số nghiên cứu đã chỉ ra mối liên hệ giữa tính cách và tuổi thọ, cho thấy phần lớn người sống thọ đều mang nhiều đặc điểm như lạc quan, cởi mở, thích kết nối mối quan hệ xã hội…
     
Nổi bật trong ngày

Game thủ Việt đua nhau mua Black Myth: Wukong "offline" với mức giá... siêu rẻ

Thứ 7, 07/09/2024 10:10
Rất nhiều người đang lựa chọn sử dụng Black Myth: Wukong phiên bản "offline" với mức giá rất phải chăng này.

140 triệu người xem "kính chiếu yêu" bóc Triệu Lộ Tư "dao kéo", Lưu Diệc Phi lão hoá ở sự kiện xa xỉ

Thứ 7, 07/09/2024 14:55
Không hẹn mà gặp, cả Lưu Diệc Phi và Triệu Lộ Tư đều bị "kính chiếu yêu" cam thường hé lộ nhan sắc thật khác với ảnh tự đăng.

VFF từng phải hoãn trận Việt Nam – Thái Lan vì trận mưa lụt lịch sử 16 năm trước

Thứ 7, 07/09/2024 20:55
Trận đấu giữa tuyển Việt Nam và Thái Lan ban đầu dự kiến diễn ra vào ngày 1/11/2008. Tuy nhiên do ảnh hưởng của mưa lớn và ngập lụt, VFF phải lùi lịch lại đến 2 tuần sau.

Cấm 100.000 tài khoản hack cheat mỗi tháng, bom tấn một thời vẫn bị tàn phá nặng nề, sắp sụp đổ "nối gót" PUBG

Thứ 7, 07/09/2024 10:20
Sau PUBG, lại chuẩn bị có thêm một tựa game sinh tồn nữa bị tàn phá nặng nề bởi vấn nạn hack cheat.

Thịt, rau để được trong tủ lạnh bao lâu? Nhiều người mua về tích trữ nhưng không hề biết

Thứ 7, 07/09/2024 15:10
Thực tế việc tích trữ quá nhiều, quá lâu lượng rau, thịt trong tủ lạnh không hề tốt như một số người vẫn nghĩ.
xe.nguoiduatin.vn