Spoločnosť Apple vydáva MGIE, revolučný model umelej inteligencie na úpravu obrázkov na základe pokynov

Create an illustration in 3:2 aspect ratio representing the major themes of the article. Include an image of a innovative AI model called MGIE, depicted as a smart helper interacting with a photo editing software interface. Make sure to depict the software performing complex image edits based on written text instructions, showcasing pixel-level manipulations like color adjustments and object manipulation. The illustration should reflect a positive, light-hearted, and whimsical style, highlighting the revolutionary and transformative potential of MGIE. Add a globe icon to symbolize the tool's accessibility and universal use. Lastly, include a sign or banner reading 'Open Source', reflecting MGIE's availability on GitHub.

Apple uvoľnil nový model umelej inteligencie s otvoreným zdrojovým kódom s názvom MGIE, ktorý dokáže upravovať obrázky na základe pokynov v prirodzenom jazyku. MGIE, vyvinutý v spolupráci s výskumníkmi z Kalifornskej univerzity v Santa Barbare, využíva multimodálne veľké jazykové modely (MLLM) na interpretáciu príkazov používateľa a vykonávanie manipulácií na úrovni pixelov. Model dokáže spracovať rôzne aspekty úprav vrátane úprav v štýle Photoshopu, globálnej optimalizácie fotografií a lokálnych úprav. MGIE integruje MLLM do procesu úprav obrázkov odvodením expresívnych pokynov zo vstupných údajov používateľa a generovaním vizuálnych predstáv pre požadované úpravy. Dokáže vykonávať širokú škálu scenárov úprav, od jednoduchých úprav farieb až po komplexné manipulácie s objektmi. MGIE je k dispozícii ako projekt s otvoreným zdrojovým kódom na GitHube, pričom k dispozícii je kód, údaje a predtrénované modely. Používatelia si môžu MGIE vyskúšať aj online prostredníctvom webovej ukážky umiestnenej na stránke Hugging Face Spaces. MGIE je prelomovým riešením v oblasti úpravy obrazu na základe inštrukcií, demonštruje potenciál MLLM a otvára nové možnosti multimodálnej interakcie. Je to praktický nástroj na rôzne účely, ktorý umožňuje používateľom vytvárať, upravovať a optimalizovať obrázky. MGIE je ukážkou rastúcich schopností spoločnosti Apple vo výskume a vývoji umelej inteligencie. Aj keď je na zdokonaľovaní multimodálnych systémov umelej inteligencie stále čo robiť, vydanie MGIE naznačuje rýchly pokrok v tejto oblasti a potenciál asistenčnej umelej inteligencie stať sa nepostrádateľným kreatívnym pomocníkom.

Celý článok

Leave a Reply