ذكاء فوياجر الاصطناعي من تينسنت يحول الصور إلى عوالم ثلاثية الأبعاد تفاعلية، ولكن مع عقبات كبيرة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

04/09/2025

button icon
ADVERTISEMENT

كشفت شركة تينسنت (Tencent) عن "فوييجر" (Voyager)، وهو نموذج رائد للذكاء الاصطناعي قادر على تحويل الصور الثابتة إلى بيئات ثلاثية الأبعاد قابلة للاستكشاف. بناءً على الأعمال السابقة في تحويل النص إلى ثلاثي الأبعاد وتوليف الفيديو، يعد فوييجر بفتح آفاق جديدة في الفن التوليدي والتجارب التفاعلية. ومع ذلك، تأتي هذه التقنية بمتطلبات حسابية كبيرة وقيود ترخيص قد تحد من انتشارها الواسع الفوري.

النقاط الرئيسية

كيف يعمل فوييجر

يُعد "فوييجر" تطورًا لنموذج "هونيوان وورلد 1.0" (HunyuanWorld 1.0) السابق من تينسنت. تستفيد عملية تدريبه من خط أنابيب بيانات آلي يحلل مقاطع الفيديو الموجودة لتحديد حركات الكاميرا والعمق لكل إطار. وهذا يلغي الحاجة إلى التسمية اليدوية للبيانات، مما يسمح للباحثين بمعالجة مجموعة بيانات ضخمة تضم أكثر من 100,000 مقطع فيديو، مصدرها تسجيلات من العالم الحقيقي وعروض Unreal Engine.

ADVERTISEMENT

المتطلبات الحسابية والترخيص

تشغيل "فوييجر" ليس بالأمر الهين من الناحية الحسابية. يتطلب النموذج ما لا يقل عن 60 جيجابايت من ذاكرة وحدة معالجة الرسوميات (GPU) لدقة 540 بكسل، ويوصى بـ 80 جيجابايت للحصول على الأداء الأمثل. وقد أتاحت تينسنت أوزان النموذج على Hugging Face، بالإضافة إلى رمز متوافق مع إعدادات وحدة معالجة رسوميات واحدة ومتعددة. لمعالجة أسرع، يدعم النظام الاستدلال المتوازي عبر وحدات معالجة رسوميات متعددة، حيث أفادت التقارير أن ثماني وحدات معالجة رسوميات توفر زيادة في السرعة بمقدار 6.69 مرة مقارنة بتكوينات وحدة معالجة رسوميات واحدة.

ADVERTISEMENT

ومع ذلك، تصاحب هذه التقنية قيود ترخيص كبيرة. على غرار نماذج Hunyuan الأخرى من تينسنت، يُحظر استخدام "فوييجر" في الاتحاد الأوروبي والمملكة المتحدة وكوريا الجنوبية. علاوة على ذلك، تتطلب أي تطبيقات تجارية تصل إلى أكثر من 100 مليون مستخدم نشط شهريًا اتفاقية ترخيص منفصلة مع تينسنت.

الأداء والإمكانات المستقبلية

على معيار WorldScore، وهو مقياس طوره باحثون من جامعة ستانفورد لتقييم توليد العوالم، تفوق "فوييجر" على المنافسين مثل WonderWorld وCogVideoX-I2V. حقق أعلى درجة إجمالية بلغت 77.62، مما يدل على قوة خاصة في التحكم في الكائنات وتناسق الأسلوب. وبينما احتل المركز الثاني في التحكم بالكاميرا، يشير أداؤه العام إلى قفزة كبيرة في توليد بيئات ثلاثية الأبعاد متماسكة ومتناسقة بصريًا.

ADVERTISEMENT

على الرغم من نتائج المعيار الواعدة هذه، فإن المتطلبات الحسابية الكبيرة والقيود في توليد "عوالم" طويلة ومتماسكة تعني أن التجارب التفاعلية في الوقت الفعلي قد لا تزال بعيدة المنال. ومع ذلك، يمثل "فوييجر" خطوة أولى مثيرة نحو عصر جديد من الفن التوليدي والمحتوى الرقمي التفاعلي، على غرار التجارب المبكرة في الإبداع البصري المدفوع بالذكاء الاصطناعي.

قراءة مقترحة

27-06-2025
صور Google تعزز البحث بالذكاء الاصطناعي بسرعة كلاسيكية
تحديثات صور Google لميزة الذكاء الاصطناعي "اسأل الصور"، ودمج البحث الكلاسيكي مع الذكاء الاصطناعي لتقديم نتائج أسرع وأكثر دقة، واستئناف طرحها في جميع أنحاء الولايات المتحدة.
ADVERTISEMENT
18-06-2025
جوجل تطلق نماذج Gemini 2.5 AI الجاهزة للإنتاج، مما يكثف التحدي لـ OpenAI
تطلق جوجل نماذج Gemini 2.5 AI الجاهزة للإنتاج، بما في ذلك Pro و Flash و Flash-Lite، لتحدي هيمنة OpenAI على الشركات من خلال تعزيز التفكير والعروض المتدرجة والتسعير القوي.
27-05-2025
اكتشاف مجرة قديمة عمرها 11 مليار سنة محاطة بحلقة ضوئية مثالية
اكتشاف مجرة قديمة عمرها 11 مليار سنة محاطة بحلقة ضوئية مثالية، يكشف عن أسرار الكون المبكر.
13-06-2025
بوز ترتقي بتجربة الصوت مع سماعات الأذن QuietComfort Ultra المطورة ومكبرات الصوت SoundLink الجديدة
تكشف Bose عن سماعات الأذن الجديدة QuietComfort Ultra المزودة بتقنية إلغاء الضوضاء التكيفية المتقدمة وجودة مكالمات محسّنة، بالإضافة إلى مكبرات الصوت المحمولة SoundLink Micro المحدثة و SoundLink Plus الجديدة.
ADVERTISEMENT
15-10-2025
سيركولاس تكشف عن توسع عالمي لروبوت الرفيق البشري PIBO
توسع شركة سيركولس روبوتها الرفيق البشري PIBO إلى الولايات المتحدة وأوروبا والصين، وتقدم ميزات الذكاء الاصطناعي المتقدمة والصداقة لجمهور عالمي.
26-09-2025
IEEE تكشف عن إطار عمل لمعايير الروبوتات البشرية
تنشر مجموعة دراسة IEEE إطار عمل لمعايير الروبوتات الشبيهة بالبشر، مع التركيز على التصنيف والاستقرار وتفاعل الإنسان والروبوت لضمان النشر الآمن.
26-09-2025
أمازون فاير تي في تستعد للتخلي عن أندرويد لصالح نظام تشغيل لينكس خاص بها في عام 2025
يُقال إن أجهزة أمازون فاير تي في تستعد للتخلي عن أندرويد لصالح نظام تشغيل خاص قائم على لينكس، يحمل الاسم الرمزي فيغا، في عام 2025، مما يوفر تحكمًا أكبر وتكاملًا معززًا للذكاء الاصطناعي.
ADVERTISEMENT
22-10-2025
أحدث إصدارات بيتا من آبل تقدم خيار "ملون" لتهدئة واجهة الزجاج السائل المثيرة للجدل
تتضمن الإصدارات التجريبية الجديدة من iOS و macOS من Apple تبديل "Tinted" لضبط واجهة "Liquid Glass"، مما يوفر قابلية قراءة وتباين أفضل.
27-06-2025
سكان توفالو يلتمسون اللجوء في أستراليا مع تهديد ارتفاع منسوب البحار لوطنهم
تعرف على نضال توفالو ضد ارتفاع منسوب مياه البحر وبرنامج أستراليا الرائد للتأشيرة المناخية الذي يوفر الملاذ لمواطنيها. اكتشف التحديات التي تواجهها هذه الدولة الجزرية وجهودها للحفاظ على هويتها.
20-08-2025
الذكاء الاصطناعي لـ Meta يترجم محتوى فيسبوك وإنستغرام لربط الجماهير العالمية
تُقدّم ميتا أدوات ترجمة مدعومة بالذكاء الاصطناعي لفيسبوك وإنستغرام، مما يتيح الترجمة الفورية للمحتوى الذي ينشئه المستخدمون ويعزز التواصل العالمي.
ADVERTISEMENT