“جوجل” تطلق نموذج الذكاء الاصطناعي “جيميني 2.5” بميزات متقدمة لتحرير الصور

أطلقت شركة “جوجل” الأمريكية الإصدار الجديد من نموذجها للذكاء الاصطناعي “جيميني 2.5″، متضمناً قدرات مبتكرة لتحرير وتوليد الصور تحت اسم “جيميني 2.5 فلاش إيمدج” أو “نانو بانانا”.
أبرز الميزات التقنية
يشمل التحديث أدوات متقدمة مثل دمج الصور المتعددة، التحرير القائم على المطالبات النصية، والحفاظ على اتساق العناصر البصرية مثل الشخصيات أو المنتجات عبر مشاهد مختلفة، وهو ما يُعد تحديًا بارزًا في النماذج التوليدية.
قدرات تحرير دقيقة
يدعم “جيميني 2.5” تعديل الخلفيات، إزالة الكائنات أو استبدالها، وضبط تفاصيل دقيقة كالوضعيات، مع إمكانية العودة إلى الصورة الأصلية عند الطلب. كما يتيح دمج عناصر من صور متعددة لإنتاج مخرجات أكثر ثراء.
تكامل النص والصورة
بفضل تكامل “المعرفة العالمية”، يستطيع النموذج فهم المعاني الدلالية للصور، ما يفتح المجال أمام تطبيقات تعليمية وعملية مثل تفسير المخططات أو تصميم القوالب.
انطباعات أولية
أشاد المصمم الصناعي توماس بروين بقدرات النموذج قائلاً: “وجدت أنه بارع في تحرير الصور مثل تعديل الخلفية أو إضافة عناصر، بل ويمكنه إعادة الصورة إلى أصلها عند الطلب، وهو أمر يتفوق فيه على بعض النماذج المنافسة”.