Apple açıq mənbəli AI şəkil redaktə modeli üzərində işləyir

Apple MLLM-Guided Image Editing və ya “MGIE” adlı açıq mənbəli multimodal AI modelinin buraxılması ilə süni intellektlə təsvirin redaktəsi sahəsinə daxil olub. Apple və Santa Barbara Kaliforniya Universitetinin tədqiqatçıları tərəfindən hazırlanmış MGIE Photoshop-a bənzər sadə mətn əmrləri əsasında təsvirin redaktə edilməsinə imkan verir.

Apple süni intellekt planları ilə bağlı nisbətən ehtiyatlı davransa da, hesabatlar onların “Apple GPT” kimi tanınan ChatGPT-yə bənzər daxili chatbotunun olduğunu göstərir. CEO Tim Cook, bu ilin sonunda əsas süni intellekt elanlarına işarə edərək, şəkil redaktə alətlərində potensial inkişaflar haqqında fərziyyələrə səbəb oldu.

MGIE təbii dil əmrlərini və təsvir təlim məlumatlarını başa düşmək üçün multimodal böyük dil modellərindən (MLLM) istifadə etməklə fərqlənir. Bu yanaşma MGIE-yə ifadəli təlimatları daha dəqiq şərh etməyə imkan verir və bu, daha effektiv şəkil redaktə nəticələrinə gətirib çıxarır.

Məsələn, MGIE, “bunu daha sağlam et” əmrini tərəvəz əlavə etmək kimi şərh edərək bibərli pizzanı yaxşılaşdıra bilər, nəticədə pizza yaşıl tərəvəzlərlə doldurulur. Başqa bir misalda, MGIE, digər modellərlə müqayisədə qabaqcıl imkanlarını nümayiş etdirərək, həm də suda şimşək çaxmasını əks etdirərkən, meşəlik sahil mənzərəsinə uğurla ildırım əlavə edir.

Model GitHub-da açıq mənbə kimi və Hugging Face-də yerləşdirilən demo versiyası kimi Apple-ın süni intellekt təsviri redaktə texnologiyasını təkmilləşdirmək öhdəliyini nümayiş etdirir.

Total
0
Shares
Leave a Reply
Related Posts
Daha çox

Google, Apple-ın süni intellekt küləyini arxasına alıb?

Texnologiya dünyası Google və Apple arasında sürətlə inkişaf edən süni intellekt rəqabətinin şahidi olur. Google, son tədbirində təqdim etdiyi yeni süni intellekt köməkçisi Gemini Live ilə diqqət çəkdi. Android 15 əməliyyat sisteminə inteqrasiya olunmuş bu yenilikçi köməkçi istifadəçilərlə təbii şəkildə söhbət etmək imkanına malikdir. Bununla belə, Apple-ın süni intellektlə bağlı da böyük planları var. Bəs bu iki texnologiya nəhəngi arasında süni intellekt yarışı necə formalaşacaq?
Daha çox

Android Studio Android işlənməsini daha sürətləndirmək və asanlaşdırmaq üçün Gemini Pro-dan istifadə edir

Google, Android tətbiqi yaradıcıları üçün inkişaf təcrübəsini təkmilləşdirərək, Gemini AI texnologiyasını Android Studio-da genişləndirir. Android Studio-ya inteqrasiya olunmuş Gemini 1.0 Pro ilə tərtibatçılar daha sürətli və daha səmərəli Android proqramları hazırlaya bilərlər. Xüsusilə, daxili sınaq zamanı cavab keyfiyyətində əhəmiyyətli irəliləyişlər müşahidə edilmişdir.
Daha çox

Veb üçün Copilot, yeni funksiya və səslər daxil olmaqla, qəfil təkmilləşdirmə əldə edir

Bir neçə gün əvvəl şayiələr yayıldı ki, Copilot mobil tətbiqi süni intellekt üzrə köməkçidən daha çox xəbər aparıcısına çevriləcək. Bununla belə, görünür ki, şirkət gözlənilməz bir dönüş yaşadı. Bir gecədə və əvvəlcədən xəbərdarlıq edilmədən görünən Copilot-un veb versiyası dörd yeni səs və gündəlik xəbər funksiyasını təqdim edən əhəmiyyətli bir yeniləmə aldı.