
التكنولوجيا اليومية
·27/08/2025
جوجل تكشف عن ترقية كبيرة لتقنيتها في توليد الصور بالذكاء الاصطناعي مع Gemini 2.5 Flash Image، المعروفة أيضًا بالاسم الرمزي nano-banana. يعد هذا النموذج الجديد بدقة معززة ومجموعة من الميزات القوية المصممة للتنافس مباشرة مع اللاعبين الراسخين مثل OpenAI. يتيح التحديث تحكمًا إبداعيًا أكبر، مما يمكّن المستخدمين من دمج الصور، والحفاظ على اتساق الشخصيات عبر أجيال متعددة، وإجراء تعديلات تفصيلية على عناصر صور محددة.
يقدم Gemini 2.5 Flash Image من جوجل العديد من الميزات الرائدة. تعد القدرة على الحفاظ على اتساق الشخصيات ميزة بارزة، حيث تتيح للمستخدمين وضع نفس الشخصية التي تم إنشاؤها بواسطة الذكاء الاصطناعي في سيناريوهات مختلفة أو عرض منتج من زوايا متعددة مع الحفاظ على سماته الأساسية. وهذا لا يقدر بثمن لإنشاء أصول علامة تجارية متسقة أو لسرد القصص.
علاوة على ذلك، يمكّن النموذج المستخدمين من قدرات التحرير الدقيقة. وهذا يعني أن إجراء تعديلات دقيقة مثل تمويه الخلفية أو تغيير لون قطعة ملابس يصبح أمرًا سهلاً. وتعد القدرة على دمج صور متعددة في صورة بصرية واحدة ومتماسكة تقدمًا كبيرًا آخر. تخيل تحميل صورة لغرفتك ثم دمج صور لأثاث جديد، ووضعها بالضبط حيث تتخيلها. يمكن لهذه الميزة أن تحدث ثورة في كيفية تصور المستهلكين للمنتجات في مساحاتهم الخاصة قبل إجراء عملية الشراء.
يُظهر Gemini 2.5 Flash Image أيضًا قدرة قوية على الالتزام بالقوالب المرئية، مما يجعله مثاليًا لإنشاء عناصر مثل بطاقات قوائم العقارات، وشارات الموظفين، أو حتى صور مصغرة لمقاطع فيديو يوتيوب. وقد تم عرض قدرات النموذج في البداية على LMArena، وهي منصة تستخدم لتقييمات أداء الذكاء الاصطناعي، تحت الاسم الرمزي nano-banana.
والأهم من ذلك، وضعت جوجل Gemini 2.5 Flash Image كخيار أكثر ملاءمة للميزانية. حيث يبلغ سعر واجهة برمجة التطبيقات (API) الخاصة به 30 دولارًا لكل مليون رمز إخراج، وهو ما يقل عن 40 دولارًا لكل مليون رمز إخراج لدى OpenAI. هذه الميزة التنافسية في التكلفة، جنبًا إلى جنب مع ميزاته المتقدمة، تضع مولد الصور الجديد بالذكاء الاصطناعي من جوجل كمنافس قوي في مشهد الذكاء الاصطناعي سريع التطور. يمكن للمستخدمين الوصول إلى هذه القدرات الجديدة من خلال تطبيق Gemini و Google AI Studio.