ذكاء فوياجر الاصطناعي من تينسنت يحول الصور إلى عوالم ثلاثية الأبعاد تفاعلية، ولكن مع عقبات كبيرة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

04/09/2025

button icon
ADVERTISEMENT

كشفت شركة تينسنت (Tencent) عن "فوييجر" (Voyager)، وهو نموذج رائد للذكاء الاصطناعي قادر على تحويل الصور الثابتة إلى بيئات ثلاثية الأبعاد قابلة للاستكشاف. بناءً على الأعمال السابقة في تحويل النص إلى ثلاثي الأبعاد وتوليف الفيديو، يعد فوييجر بفتح آفاق جديدة في الفن التوليدي والتجارب التفاعلية. ومع ذلك، تأتي هذه التقنية بمتطلبات حسابية كبيرة وقيود ترخيص قد تحد من انتشارها الواسع الفوري.

النقاط الرئيسية

كيف يعمل فوييجر

يُعد "فوييجر" تطورًا لنموذج "هونيوان وورلد 1.0" (HunyuanWorld 1.0) السابق من تينسنت. تستفيد عملية تدريبه من خط أنابيب بيانات آلي يحلل مقاطع الفيديو الموجودة لتحديد حركات الكاميرا والعمق لكل إطار. وهذا يلغي الحاجة إلى التسمية اليدوية للبيانات، مما يسمح للباحثين بمعالجة مجموعة بيانات ضخمة تضم أكثر من 100,000 مقطع فيديو، مصدرها تسجيلات من العالم الحقيقي وعروض Unreal Engine.

ADVERTISEMENT

المتطلبات الحسابية والترخيص

تشغيل "فوييجر" ليس بالأمر الهين من الناحية الحسابية. يتطلب النموذج ما لا يقل عن 60 جيجابايت من ذاكرة وحدة معالجة الرسوميات (GPU) لدقة 540 بكسل، ويوصى بـ 80 جيجابايت للحصول على الأداء الأمثل. وقد أتاحت تينسنت أوزان النموذج على Hugging Face، بالإضافة إلى رمز متوافق مع إعدادات وحدة معالجة رسوميات واحدة ومتعددة. لمعالجة أسرع، يدعم النظام الاستدلال المتوازي عبر وحدات معالجة رسوميات متعددة، حيث أفادت التقارير أن ثماني وحدات معالجة رسوميات توفر زيادة في السرعة بمقدار 6.69 مرة مقارنة بتكوينات وحدة معالجة رسوميات واحدة.

ADVERTISEMENT

ومع ذلك، تصاحب هذه التقنية قيود ترخيص كبيرة. على غرار نماذج Hunyuan الأخرى من تينسنت، يُحظر استخدام "فوييجر" في الاتحاد الأوروبي والمملكة المتحدة وكوريا الجنوبية. علاوة على ذلك، تتطلب أي تطبيقات تجارية تصل إلى أكثر من 100 مليون مستخدم نشط شهريًا اتفاقية ترخيص منفصلة مع تينسنت.

الأداء والإمكانات المستقبلية

على معيار WorldScore، وهو مقياس طوره باحثون من جامعة ستانفورد لتقييم توليد العوالم، تفوق "فوييجر" على المنافسين مثل WonderWorld وCogVideoX-I2V. حقق أعلى درجة إجمالية بلغت 77.62، مما يدل على قوة خاصة في التحكم في الكائنات وتناسق الأسلوب. وبينما احتل المركز الثاني في التحكم بالكاميرا، يشير أداؤه العام إلى قفزة كبيرة في توليد بيئات ثلاثية الأبعاد متماسكة ومتناسقة بصريًا.

ADVERTISEMENT

على الرغم من نتائج المعيار الواعدة هذه، فإن المتطلبات الحسابية الكبيرة والقيود في توليد "عوالم" طويلة ومتماسكة تعني أن التجارب التفاعلية في الوقت الفعلي قد لا تزال بعيدة المنال. ومع ذلك، يمثل "فوييجر" خطوة أولى مثيرة نحو عصر جديد من الفن التوليدي والمحتوى الرقمي التفاعلي، على غرار التجارب المبكرة في الإبداع البصري المدفوع بالذكاء الاصطناعي.

قراءة مقترحة

27-08-2025
وكيل الذكاء الاصطناعي كلود من أنثروبيك يعيش الآن داخل متصفح كروم الخاص بك
أطلقت أنثروبيك Claude for Chrome، وهو وكيل ذكاء اصطناعي مدمج في المتصفح، مما يكثف المنافسة ويعالج مخاوف السلامة في مشهد الذكاء الاصطناعي المتطور.
ADVERTISEMENT
21-08-2025
روبوت أطلس يحقق مهام معقدة بفضل الذكاء الاصطناعي الرائد، وبأقل قدر من البرمجة
اكتشف كيف يتقن روبوت أطلس من بوسطن ديناميكس ومعهد تويوتا للأبحاث المهام المعقدة بأقل قدر من البرمجة، مما يمثل قفزة كبيرة في الروبوتات البشرية.
27-06-2025
صور Google تعزز البحث بالذكاء الاصطناعي بسرعة كلاسيكية
تحديثات صور Google لميزة الذكاء الاصطناعي "اسأل الصور"، ودمج البحث الكلاسيكي مع الذكاء الاصطناعي لتقديم نتائج أسرع وأكثر دقة، واستئناف طرحها في جميع أنحاء الولايات المتحدة.
16-09-2025
كوالكوم تكشف عن سنابدراجون 8 الجيل الخامس: المحرك لأفضل هواتف أندرويد لعام 2026
تستعد كوالكوم للكشف عن سنابدراجون 8 إيليت الجيل الخامس، المعالج الذي من المتوقع أن يشغل أفضل هواتف أندرويد لعام 2026. تعرف على اصطلاح التسمية الجديد وماذا تتوقع.
ADVERTISEMENT
13-08-2025
استغلت مجموعات الجريمة السيبرانية الروسية ثغرة وينرار ليوم الصفر لأسابيع
تستغل مجموعتان روسيتان للجريمة السيبرانية، وهما رومكوم وبيبر وير وولف، بنشاط ثغرة أمنية حرجة من نوع "يوم الصفر" في برنامج وينرار (CVE-2025-8088) منذ أسابيع، وذلك لزرع أبواب خلفية في الأنظمة المستهدفة.
23-09-2025
مهمة أرتميس القمرية التابعة لناسا تواجه تأخيرًا محتملاً لسنوات طويلة بسبب مشاكل في مركبة الهبوط ستارلاينر
تواجه مهمة أرتميس القمرية التابعة لناسا تأخيرًا محتملاً لسنوات بسبب تحديات تطوير مركبة الهبوط القمرية ستارلاينر التابعة لسبيس إكس، وفقًا للجنة سلامة تابعة لناسا.
02-10-2025
ميتا تستفيد من محادثات الذكاء الاصطناعي للإعلانات والمحتوى المخصصين
تقوم Meta بدمج تفاعلات المستخدم مع الذكاء الاصطناعي في تخصيص الإعلانات والمحتوى على Facebook و Instagram، بدءًا من 16 ديسمبر. تعرف على المزيد حول التغييرات وعناصر تحكم المستخدم.
ADVERTISEMENT
17-07-2025
الحكم الآلي يظهر لأول مرة في مباراة كل النجوم: كاميرات ذكية تدعم قرارات منطقة الجزاء الآلية
ظهر نظام الكرة والضربة الآلي التابع لدوري البيسبول الرئيسي لأول مرة في مباراة كل النجوم لعام 2025، باستخدام كاميرات هوك-آي لتقدير رميات الكرة والسماح بالطعون السريعة، حيث فازت الفرق بنسبة 80٪ من النزاعات. قد يؤدي النجاح هنا إلى اعتماده على مستوى الدوري في عام 2026، على الرغم من بقاء الحكام البشريين متواجدين.
27-10-2025
مكبر صوت مسند رأس Razer Clio: تجربة صوتية قريبة المدى تخفق
مراجعة لمكبر صوت مسند رأس Razer Clio، مع فحص تصميمه وجودة الصوت ومشكلات التوافق والقيمة الإجمالية مقارنة بسماعات الألعاب التقليدية.
15-10-2025
بيانات الأقمار الصناعية معرضة للخطر: باحثون يكشفون معلومات حساسة بمعدات بأسعار معقولة
يكشف الباحثون أن البيانات الحساسة من الأقمار الصناعية، بما في ذلك الاتصالات الخلوية والعسكرية، يمكن اعتراضها بمعدات لا تتجاوز قيمتها 750 دولارًا، مما يسلط الضوء على ثغرات أمنية كبيرة.
ADVERTISEMENT