مولد صور الذكاء الاصطناعي الجديد من جوجل يستعد لتحدي OpenAI

التكنولوجيا اليومية

27/08/2025

جوجل تكشف عن ترقية كبيرة لتقنيتها في توليد الصور بالذكاء الاصطناعي مع Gemini 2.5 Flash Image، المعروفة أيضًا بالاسم الرمزي nano-banana. يعد هذا النموذج الجديد بدقة معززة ومجموعة من الميزات القوية المصممة للتنافس مباشرة مع اللاعبين الراسخين مثل OpenAI. يتيح التحديث تحكمًا إبداعيًا أكبر، مما يمكّن المستخدمين من دمج الصور، والحفاظ على اتساق الشخصيات عبر أجيال متعددة، وإجراء تعديلات تفصيلية على عناصر صور محددة.

النقاط الرئيسية

اتساق معزز للشخصيات: الحفاظ على مظهر شخصية معينة عبر الصور المتعددة التي تم إنشاؤها.
دمج الصور المتقدم: دمج صور متعددة بسلاسة لإنشاء مرئيات مركبة.
قدرات التحرير الدقيقة: إجراء تعديلات دقيقة على أجزاء محددة من الصورة، مثل تمويه الخلفية أو تغيير لون الملابس.
الالتزام بالقوالب: يتفوق في إنشاء مرئيات تتناسب مع قوالب محددة مثل الشارات أو بطاقات التداول.
واجهة برمجة تطبيقات فعالة من حيث التكلفة: يقدم هيكل تسعير أكثر اقتصادية مقارنة بعروض OpenAI.

إحداث ثورة في إنشاء الصور

يقدم Gemini 2.5 Flash Image من جوجل العديد من الميزات الرائدة. تعد القدرة على الحفاظ على اتساق الشخصيات ميزة بارزة، حيث تتيح للمستخدمين وضع نفس الشخصية التي تم إنشاؤها بواسطة الذكاء الاصطناعي في سيناريوهات مختلفة أو عرض منتج من زوايا متعددة مع الحفاظ على سماته الأساسية. وهذا لا يقدر بثمن لإنشاء أصول علامة تجارية متسقة أو لسرد القصص.

علاوة على ذلك، يمكّن النموذج المستخدمين من قدرات التحرير الدقيقة. وهذا يعني أن إجراء تعديلات دقيقة مثل تمويه الخلفية أو تغيير لون قطعة ملابس يصبح أمرًا سهلاً. وتعد القدرة على دمج صور متعددة في صورة بصرية واحدة ومتماسكة تقدمًا كبيرًا آخر. تخيل تحميل صورة لغرفتك ثم دمج صور لأثاث جديد، ووضعها بالضبط حيث تتخيلها. يمكن لهذه الميزة أن تحدث ثورة في كيفية تصور المستهلكين للمنتجات في مساحاتهم الخاصة قبل إجراء عملية الشراء.

الميزة التنافسية وإمكانية الوصول

يُظهر Gemini 2.5 Flash Image أيضًا قدرة قوية على الالتزام بالقوالب المرئية، مما يجعله مثاليًا لإنشاء عناصر مثل بطاقات قوائم العقارات، وشارات الموظفين، أو حتى صور مصغرة لمقاطع فيديو يوتيوب. وقد تم عرض قدرات النموذج في البداية على LMArena، وهي منصة تستخدم لتقييمات أداء الذكاء الاصطناعي، تحت الاسم الرمزي nano-banana.

والأهم من ذلك، وضعت جوجل Gemini 2.5 Flash Image كخيار أكثر ملاءمة للميزانية. حيث يبلغ سعر واجهة برمجة التطبيقات (API) الخاصة به 30 دولارًا لكل مليون رمز إخراج، وهو ما يقل عن 40 دولارًا لكل مليون رمز إخراج لدى OpenAI. هذه الميزة التنافسية في التكلفة، جنبًا إلى جنب مع ميزاته المتقدمة، تضع مولد الصور الجديد بالذكاء الاصطناعي من جوجل كمنافس قوي في مشهد الذكاء الاصطناعي سريع التطور. يمكن للمستخدمين الوصول إلى هذه القدرات الجديدة من خلال تطبيق Gemini و Google AI Studio.

06-10-2025

خطط أجهزة Xbox للجيل القادم آمنة — لكن أزمة الثقة لا تزال قائمة

مايكروسوفت تؤكد أن خطط أجهزة إكس بوكس للجيل القادم لا تزال على المسار الصحيح رغم الشائعات، لكن الانتشار السريع للمعلومات المضللة يكشف عن مشكلات ثقة أعمق بين المعجبين. اقرأ التحليل الكامل.