ذكاء فوياجر الاصطناعي من تينسنت يحول الصور إلى عوالم ثلاثية الأبعاد تفاعلية، ولكن مع عقبات كبيرة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

04/09/2025

button icon
ADVERTISEMENT

كشفت شركة تينسنت (Tencent) عن "فوييجر" (Voyager)، وهو نموذج رائد للذكاء الاصطناعي قادر على تحويل الصور الثابتة إلى بيئات ثلاثية الأبعاد قابلة للاستكشاف. بناءً على الأعمال السابقة في تحويل النص إلى ثلاثي الأبعاد وتوليف الفيديو، يعد فوييجر بفتح آفاق جديدة في الفن التوليدي والتجارب التفاعلية. ومع ذلك، تأتي هذه التقنية بمتطلبات حسابية كبيرة وقيود ترخيص قد تحد من انتشارها الواسع الفوري.

النقاط الرئيسية

كيف يعمل فوييجر

يُعد "فوييجر" تطورًا لنموذج "هونيوان وورلد 1.0" (HunyuanWorld 1.0) السابق من تينسنت. تستفيد عملية تدريبه من خط أنابيب بيانات آلي يحلل مقاطع الفيديو الموجودة لتحديد حركات الكاميرا والعمق لكل إطار. وهذا يلغي الحاجة إلى التسمية اليدوية للبيانات، مما يسمح للباحثين بمعالجة مجموعة بيانات ضخمة تضم أكثر من 100,000 مقطع فيديو، مصدرها تسجيلات من العالم الحقيقي وعروض Unreal Engine.

ADVERTISEMENT

المتطلبات الحسابية والترخيص

تشغيل "فوييجر" ليس بالأمر الهين من الناحية الحسابية. يتطلب النموذج ما لا يقل عن 60 جيجابايت من ذاكرة وحدة معالجة الرسوميات (GPU) لدقة 540 بكسل، ويوصى بـ 80 جيجابايت للحصول على الأداء الأمثل. وقد أتاحت تينسنت أوزان النموذج على Hugging Face، بالإضافة إلى رمز متوافق مع إعدادات وحدة معالجة رسوميات واحدة ومتعددة. لمعالجة أسرع، يدعم النظام الاستدلال المتوازي عبر وحدات معالجة رسوميات متعددة، حيث أفادت التقارير أن ثماني وحدات معالجة رسوميات توفر زيادة في السرعة بمقدار 6.69 مرة مقارنة بتكوينات وحدة معالجة رسوميات واحدة.

ADVERTISEMENT

ومع ذلك، تصاحب هذه التقنية قيود ترخيص كبيرة. على غرار نماذج Hunyuan الأخرى من تينسنت، يُحظر استخدام "فوييجر" في الاتحاد الأوروبي والمملكة المتحدة وكوريا الجنوبية. علاوة على ذلك، تتطلب أي تطبيقات تجارية تصل إلى أكثر من 100 مليون مستخدم نشط شهريًا اتفاقية ترخيص منفصلة مع تينسنت.

الأداء والإمكانات المستقبلية

على معيار WorldScore، وهو مقياس طوره باحثون من جامعة ستانفورد لتقييم توليد العوالم، تفوق "فوييجر" على المنافسين مثل WonderWorld وCogVideoX-I2V. حقق أعلى درجة إجمالية بلغت 77.62، مما يدل على قوة خاصة في التحكم في الكائنات وتناسق الأسلوب. وبينما احتل المركز الثاني في التحكم بالكاميرا، يشير أداؤه العام إلى قفزة كبيرة في توليد بيئات ثلاثية الأبعاد متماسكة ومتناسقة بصريًا.

ADVERTISEMENT

على الرغم من نتائج المعيار الواعدة هذه، فإن المتطلبات الحسابية الكبيرة والقيود في توليد "عوالم" طويلة ومتماسكة تعني أن التجارب التفاعلية في الوقت الفعلي قد لا تزال بعيدة المنال. ومع ذلك، يمثل "فوييجر" خطوة أولى مثيرة نحو عصر جديد من الفن التوليدي والمحتوى الرقمي التفاعلي، على غرار التجارب المبكرة في الإبداع البصري المدفوع بالذكاء الاصطناعي.

قراءة مقترحة

18-09-2025
جوجل تكشف عن إكسسوار "سوار المعصم الحبل" لهواتف بكسل، على خطى آبل
تطلق جوجل إكسسوار "حبل المعصم" لهواتف بكسل، وهو حبل من البوليستر مع حلقة تسلق، بسعر 7 دولارات. تعرف على تصميمه، توافقه، وكيف يقارن بعروض أبل.
ADVERTISEMENT
28-09-2025
ميتا تهدف إلى تشغيل روبوتات بشرية مستقبلية ببرمجياتها
تهدف ميتا إلى أن تصبح العمود الفقري البرمجي للروبوتات البشرية المستقبلية، مع التركيز على ترخيص تقنيتها لمصنعي الأجهزة بدلاً من إنتاج الروبوتات بنفسها. تستثمر الشركة بكثافة في أبحاث الذكاء الاصطناعي والروبوتات للتغلب على التحديات الرئيسية في البراعة والتلاعب.
07-08-2025
إلفن لابس تكشف عن مولد موسيقى بالذكاء الاصطناعي بتراخيص من ميرلين وكوبالت
تطلق ElevenLabs نموذجها الموسيقي المدعوم بالذكاء الاصطناعي، Eleven Music، مع صفقات ترخيص من ميرلين وكوبالت، مما يتيح إنشاء موسيقى مولدة بالذكاء الاصطناعي مع هياكل حقوق ملكية وضمانات للفنانين.
12-09-2025
إنفيديا تستثمر في أجيليتي روبوتيكس، مما يشير إلى ازدهار لموردي الروبوتات في تايوان
تستثمر إنفيديا في أجيليتي روبوتيكس، مما يعزز موردي تايوان في سوق الروبوتات البشرية سريعة التوسع. استكشف تأثير ومستقبل هذا التعاون.
ADVERTISEMENT
08-09-2025
اعتُبر روبوت الدردشة جيميني من جوجل عالي الخطورة على الأطفال بسبب مخاوف تتعلق بالسلامة
صُنّف روبوت الدردشة Gemini من جوجل عالي الخطورة على الأطفال بسبب ثغرات أمنية، وفقًا لدراسة أجرتها Common Sense Media. ويُبرز التقرير مخاوف بشأن تصفية المحتوى والرقابة الأبوية.
13-10-2025
سماعات أذن USB-C الجديدة من بيلكين توفر راحة التوصيل السلكي مع لمسة من إلغاء الضوضاء النشط
تقدم سماعات الأذن السلكية الجديدة SoundForm ANC من Belkin حلاً صوتيًا سلكيًا بأسعار معقولة مع إلغاء الضوضاء النشط، ولكن هل تنافس الخيارات اللاسلكية المتميزة؟
05-08-2025
شاشات قفل الآيفون تحصل على تحول ثلاثي الأبعاد مع مشهد iOS 26 المكاني
اكتشف كيف تحول ميزة المشهد المكاني الجديدة iOS 26 من Apple شاشة قفل iPhone الخاصة بك إلى تجربة ثلاثية الأبعاد ديناميكية. تعرف على كيفية تمكين وتخصيص تأثير الخلفية المبتكر هذا.
ADVERTISEMENT
27-10-2025
الثورة القادمة للذكاء الاصطناعي في آذانكم: لماذا أصبحت سماعات الرأس الجهاز القابل للارتداء النهائي
الثورة القادمة للذكاء الاصطناعي في آذانكم: لماذا أصبحت سماعات الرأس الجهاز القابل للارتداء النهائي
18-08-2025
معماري أجهزة Xbox يتأمل في سلسلة X|S مع بزوغ فجر عصر جديد
يتأمل كارل ليدبيتر، مهندس أجهزة Xbox، في تصميم وإرث Xbox Series X|S مع اختتام هذا الجيل، معربًا عن تفاؤله بالابتكارات المستقبلية.
17-06-2025
تقدم ثريدز نصًا مخفيًا لتحسين تجربة المستخدم
تختبر Threads ميزة نصية جديدة لإخفاء المحتوى، أعلن عنها الرئيس التنفيذي لشركة Meta مارك زوكربيرج، مما يسمح للمستخدمين بإخفاء المحتوى لمنع الكشف عن معلومات حساسة وطمسها.
ADVERTISEMENT