Apple, talimat tabanlı görüntü düzenleme için devrim niteliğinde bir yapay zeka modeli olan ‘MGIE’yi yayınladı

Create an illustration in 3:2 aspect ratio representing the major themes of the article. Include an image of a innovative AI model called MGIE, depicted as a smart helper interacting with a photo editing software interface. Make sure to depict the software performing complex image edits based on written text instructions, showcasing pixel-level manipulations like color adjustments and object manipulation. The illustration should reflect a positive, light-hearted, and whimsical style, highlighting the revolutionary and transformative potential of MGIE. Add a globe icon to symbolize the tool's accessibility and universal use. Lastly, include a sign or banner reading 'Open Source', reflecting MGIE's availability on GitHub.

Apple, doğal dil talimatlarına dayalı olarak görüntüleri düzenleyebilen MGIE adlı yeni bir açık kaynaklı yapay zeka modeli yayınladı. Santa Barbara’daki California Üniversitesi’nden araştırmacılarla işbirliği içinde geliştirilen MGIE, kullanıcı komutlarını yorumlamak ve piksel düzeyinde manipülasyonlar gerçekleştirmek için multimodal büyük dil modellerinden (MLLM’ler) yararlanıyor. Model, Photoshop tarzı modifikasyon, global fotoğraf optimizasyonu ve yerel düzenleme dahil olmak üzere çeşitli düzenleme yönlerini ele alabilir. MGIE, kullanıcı girdisinden anlamlı talimatlar türeterek ve istenen düzenlemeler için görsel hayal gücü oluşturarak MLLM’leri görüntü düzenleme sürecine entegre eder. Basit renk ayarlamalarından karmaşık nesne manipülasyonlarına kadar çok çeşitli düzenleme senaryoları gerçekleştirebilir. MGIE, GitHub’da açık kaynaklı bir proje olarak mevcut olup kod, veri ve önceden eğitilmiş modeller sağlanmaktadır. Kullanıcılar ayrıca Hugging Face Spaces üzerinde barındırılan bir web demosu aracılığıyla MGIE’yi çevrimiçi olarak deneyebilirler. MGIE, MLLM’lerin potansiyelini ortaya koyan ve modlar arası etkileşim için yeni olanaklar sunan, talimat tabanlı görüntü düzenlemede bir dönüm noktasıdır. Çeşitli amaçlar için pratik bir araçtır ve kullanıcılara görüntü oluşturma, değiştirme ve optimize etme yetkisi verir. MGIE, Apple’ın yapay zeka araştırma ve geliştirme alanındaki artan becerisini gözler önüne seriyor. Çok modlu yapay zeka sistemlerini geliştirmek için hala yapılması gereken işler olsa da, MGIE’nin piyasaya sürülmesi bu alandaki hızlı ilerlemeyi ve yardımcı yapay zekanın vazgeçilmez bir yaratıcı yardımcı olma potansiyelini gösteriyor.

Makalenin tamamı

Bir yanıt yazın