Apple merilis ‘MGIE’, sebuah model AI revolusioner untuk pengeditan gambar berbasis instruksi

Create an illustration in 3:2 aspect ratio representing the major themes of the article. Include an image of a innovative AI model called MGIE, depicted as a smart helper interacting with a photo editing software interface. Make sure to depict the software performing complex image edits based on written text instructions, showcasing pixel-level manipulations like color adjustments and object manipulation. The illustration should reflect a positive, light-hearted, and whimsical style, highlighting the revolutionary and transformative potential of MGIE. Add a globe icon to symbolize the tool's accessibility and universal use. Lastly, include a sign or banner reading 'Open Source', reflecting MGIE's availability on GitHub.

Apple telah merilis model AI open-source baru yang disebut MGIE, yang dapat mengedit gambar berdasarkan instruksi bahasa alami. Dikembangkan melalui kolaborasi dengan para peneliti dari University of California, Santa Barbara, MGIE memanfaatkan model bahasa besar multimodal (MLLM) untuk menginterpretasikan perintah pengguna dan melakukan manipulasi pada tingkat piksel. Model ini dapat menangani berbagai aspek pengeditan, termasuk modifikasi gaya Photoshop, pengoptimalan foto global, dan pengeditan lokal. MGIE mengintegrasikan MLLM ke dalam proses penyuntingan gambar dengan memperoleh instruksi ekspresif dari input pengguna dan menghasilkan imajinasi visual untuk penyuntingan yang diinginkan. MGIE dapat melakukan berbagai skenario pengeditan, mulai dari penyesuaian warna yang sederhana hingga manipulasi objek yang kompleks. MGIE tersedia sebagai proyek sumber terbuka di GitHub, dengan kode, data, dan model yang telah dilatih sebelumnya. Pengguna juga dapat mencoba MGIE secara online melalui demo web yang dihosting di Hugging Face Spaces. MGIE merupakan terobosan dalam pengeditan gambar berbasis instruksi, yang menunjukkan potensi MLLM dan membuka kemungkinan baru untuk interaksi lintas modal. Ini adalah alat praktis untuk berbagai tujuan, memberdayakan pengguna untuk membuat, memodifikasi, dan mengoptimalkan gambar. MGIE menampilkan kehebatan Apple yang terus berkembang dalam penelitian dan pengembangan AI. Meskipun masih ada pekerjaan yang harus dilakukan untuk meningkatkan sistem AI multimodal, peluncuran MGIE menunjukkan kemajuan pesat di bidang ini dan potensi AI yang membantu untuk menjadi sahabat kreatif yang sangat diperlukan.

Artikel lengkap

Tinggalkan Balasan