ذكاء فوياجر الاصطناعي من تينسنت يحول الصور إلى عوالم ثلاثية الأبعاد تفاعلية، ولكن مع عقبات كبيرة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

04/09/2025

button icon
ADVERTISEMENT

كشفت شركة تينسنت (Tencent) عن "فوييجر" (Voyager)، وهو نموذج رائد للذكاء الاصطناعي قادر على تحويل الصور الثابتة إلى بيئات ثلاثية الأبعاد قابلة للاستكشاف. بناءً على الأعمال السابقة في تحويل النص إلى ثلاثي الأبعاد وتوليف الفيديو، يعد فوييجر بفتح آفاق جديدة في الفن التوليدي والتجارب التفاعلية. ومع ذلك، تأتي هذه التقنية بمتطلبات حسابية كبيرة وقيود ترخيص قد تحد من انتشارها الواسع الفوري.

النقاط الرئيسية

كيف يعمل فوييجر

يُعد "فوييجر" تطورًا لنموذج "هونيوان وورلد 1.0" (HunyuanWorld 1.0) السابق من تينسنت. تستفيد عملية تدريبه من خط أنابيب بيانات آلي يحلل مقاطع الفيديو الموجودة لتحديد حركات الكاميرا والعمق لكل إطار. وهذا يلغي الحاجة إلى التسمية اليدوية للبيانات، مما يسمح للباحثين بمعالجة مجموعة بيانات ضخمة تضم أكثر من 100,000 مقطع فيديو، مصدرها تسجيلات من العالم الحقيقي وعروض Unreal Engine.

ADVERTISEMENT

المتطلبات الحسابية والترخيص

تشغيل "فوييجر" ليس بالأمر الهين من الناحية الحسابية. يتطلب النموذج ما لا يقل عن 60 جيجابايت من ذاكرة وحدة معالجة الرسوميات (GPU) لدقة 540 بكسل، ويوصى بـ 80 جيجابايت للحصول على الأداء الأمثل. وقد أتاحت تينسنت أوزان النموذج على Hugging Face، بالإضافة إلى رمز متوافق مع إعدادات وحدة معالجة رسوميات واحدة ومتعددة. لمعالجة أسرع، يدعم النظام الاستدلال المتوازي عبر وحدات معالجة رسوميات متعددة، حيث أفادت التقارير أن ثماني وحدات معالجة رسوميات توفر زيادة في السرعة بمقدار 6.69 مرة مقارنة بتكوينات وحدة معالجة رسوميات واحدة.

ADVERTISEMENT

ومع ذلك، تصاحب هذه التقنية قيود ترخيص كبيرة. على غرار نماذج Hunyuan الأخرى من تينسنت، يُحظر استخدام "فوييجر" في الاتحاد الأوروبي والمملكة المتحدة وكوريا الجنوبية. علاوة على ذلك، تتطلب أي تطبيقات تجارية تصل إلى أكثر من 100 مليون مستخدم نشط شهريًا اتفاقية ترخيص منفصلة مع تينسنت.

الأداء والإمكانات المستقبلية

على معيار WorldScore، وهو مقياس طوره باحثون من جامعة ستانفورد لتقييم توليد العوالم، تفوق "فوييجر" على المنافسين مثل WonderWorld وCogVideoX-I2V. حقق أعلى درجة إجمالية بلغت 77.62، مما يدل على قوة خاصة في التحكم في الكائنات وتناسق الأسلوب. وبينما احتل المركز الثاني في التحكم بالكاميرا، يشير أداؤه العام إلى قفزة كبيرة في توليد بيئات ثلاثية الأبعاد متماسكة ومتناسقة بصريًا.

ADVERTISEMENT

على الرغم من نتائج المعيار الواعدة هذه، فإن المتطلبات الحسابية الكبيرة والقيود في توليد "عوالم" طويلة ومتماسكة تعني أن التجارب التفاعلية في الوقت الفعلي قد لا تزال بعيدة المنال. ومع ذلك، يمثل "فوييجر" خطوة أولى مثيرة نحو عصر جديد من الفن التوليدي والمحتوى الرقمي التفاعلي، على غرار التجارب المبكرة في الإبداع البصري المدفوع بالذكاء الاصطناعي.

قراءة مقترحة

27-05-2025
مباراة الكيك بوكسينغ الأولى بين الروبوتات: هل تعلمت الآلات القتال؟
استضافت الصين أول مباراة كيك بوكسينغ بين الروبوتات، حيث أظهرت الروبوتات مهارات مذهلة في القتال، مما أثار مشاعر الإعجاب والقلق بين المشاهدين.
ADVERTISEMENT
16-06-2025
لوحة المفاتيح بقيمة 3600 دولار: داخل سعي ريان نورباور للحصول على جهاز 'نهاية اللعبة'
استكشف إنشاء لوحة مفاتيح Seneca التي تبلغ تكلفتها 3600 دولار من قبل ريان نورباور، مع تفصيل تصميمها المخصص وابتكاراتها الهندسية والفلسفة وراء بناء تجربة الكتابة "النهائية".
15-09-2025
خارطة طريق آبل المستقبلية: شرائح M5، تحديثات Vision Pro، وأجهزة منزلية ذكية جديدة في الأفق
استكشف خارطة طريق منتجات Apple القادمة لأواخر عام 2025 وعام 2026، بما في ذلك أجهزة شريحة M5، وتحديثات Vision Pro، وAirTag 2، وابتكارات المنزل الذكي الجديدة.
19-09-2025
نظارات ميتا الذكية تثير إعجاب المختبرين الأوائل رغم العروض التجريبية المعيبة
أبدى المختبرون الأوائل لنظارات ميتا الذكية الجديدة Ray-Ban Display إعجابهم بجودة العرض وميزات الخصوصية، على الرغم من المخاوف الأولية التي أثارتها مقاطع الفيديو التجريبية التي كانت بها أخطاء. توفر نظارات الواقع المعزز (AR) التي يبلغ سعرها 799 دولارًا تجربة بصرية سلسة وعناصر تحكم مبتكرة بالإيماءات.
ADVERTISEMENT
20-05-2025
زيادة استخدام الوكلاء الذكاء الاصطناعي: ما قاله CTO مايكروسوفت في مؤتمر Build 2025
في مؤتمر Build 2025، أعلن CTO مايكروسوفت عن تضاعف عدد مستخدمي وكلاء الذكاء الاصطناعي، مع تقديم أدوات جديدة لتعزيز الإنتاجية.
29-09-2025
راي بان ميتا الجيل الثاني: أفضل النظارات الذكية بدون شاشة، ولكن هل تستحق الترقية؟
مراجعة شاملة لنظارات Ray-Ban Meta Gen 2 الذكية، تسلط الضوء على التحسينات في عمر البطارية وتسجيل الفيديو، مع مناقشة قيود Meta AI ومخاوف الخصوصية.
24-06-2025
حصريات كوميك كون سان دييغو: 'العودة إلى المستقبل' و'الفك المفترس' تحصلان على معاملة هوت ويلز الحنينية
تكشف Hot Wheels من Mattel عن مجموعات حصرية من 'Jaws' و 'Back to the Future' لـ SDCC، احتفالًا بالذكرى السنوية للأفلام مع مقتنيات مصغرة تبعث على الحنين.
ADVERTISEMENT
20-06-2025
نظارات Xreal One Pro الذكية: لمحة عن مستقبل الشاشات القابلة للارتداء في مؤتمر WWDC
يستعرض مراسل CNET نظارة Xreal One Pro الذكية في مؤتمر WWDC، مسلطًا الضوء على فائدتها كشاشة محمولة ووضع الشفافية التلقائية المبتكر، مما يعرض المشهد المتطور لتقنية النظارات الذكية.
15-08-2025
الروبوتات تتصدر المشهد: ألعاب الروبوتات البشرية العالمية 2025 تنطلق في بكين
افتتحت ألعاب الروبوتات البشرية العالمية 2025 في بكين، بمشاركة أكثر من 500 روبوت من 16 دولة، تعرض التعاون بين الإنسان والآلة من خلال عروض ثقافية وتكنولوجية.
24-06-2025
لقد حصل هاتف Android الخاص بك للتو على ترقية Gemini رئيسية لمحبي الموسيقى
اكتشف كيف حصل مساعد جوجل Gemini AI على هواتف أندرويد على ترقية رئيسية ومجانية لمحبي الموسيقى، مما يتيح التعرف السهل على الأغاني عن طريق الاستماع أو الدندنة.
ADVERTISEMENT