Apple MLLM-Guided Image Editing və ya “MGIE” adlı açıq mənbəli multimodal AI modelinin buraxılması ilə süni intellektlə təsvirin redaktəsi sahəsinə daxil olub. Apple və Santa Barbara Kaliforniya Universitetinin tədqiqatçıları tərəfindən hazırlanmış MGIE Photoshop-a bənzər sadə mətn əmrləri əsasında təsvirin redaktə edilməsinə imkan verir.
Apple süni intellekt planları ilə bağlı nisbətən ehtiyatlı davransa da, hesabatlar onların “Apple GPT” kimi tanınan ChatGPT-yə bənzər daxili chatbotunun olduğunu göstərir. CEO Tim Cook, bu ilin sonunda əsas süni intellekt elanlarına işarə edərək, şəkil redaktə alətlərində potensial inkişaflar haqqında fərziyyələrə səbəb oldu.
MGIE təbii dil əmrlərini və təsvir təlim məlumatlarını başa düşmək üçün multimodal böyük dil modellərindən (MLLM) istifadə etməklə fərqlənir. Bu yanaşma MGIE-yə ifadəli təlimatları daha dəqiq şərh etməyə imkan verir və bu, daha effektiv şəkil redaktə nəticələrinə gətirib çıxarır.
Məsələn, MGIE, “bunu daha sağlam et” əmrini tərəvəz əlavə etmək kimi şərh edərək bibərli pizzanı yaxşılaşdıra bilər, nəticədə pizza yaşıl tərəvəzlərlə doldurulur. Başqa bir misalda, MGIE, digər modellərlə müqayisədə qabaqcıl imkanlarını nümayiş etdirərək, həm də suda şimşək çaxmasını əks etdirərkən, meşəlik sahil mənzərəsinə uğurla ildırım əlavə edir.
Model GitHub-da açıq mənbə kimi və Hugging Face-də yerləşdirilən demo versiyası kimi Apple-ın süni intellekt təsviri redaktə texnologiyasını təkmilləşdirmək öhdəliyini nümayiş etdirir.