التكنولوجيا اليومية
·19/06/2025
كشفت Midjourney، خدمة توليد الصور بالذكاء الاصطناعي الشهيرة، عن نموذجها الأول للفيديو بالذكاء الاصطناعي، V1، مما يمثل توسعًا كبيرًا في إنشاء محتوى الوسائط المتعددة. يضع هذا الإطلاق Midjourney في سوق الفيديو المزدهر بالذكاء الاصطناعي، حتى في الوقت الذي تواجه فيه دعوى قضائية كبيرة لانتهاك حقوق الطبع والنشر من عمالقة الترفيه ديزني ويونيفرسال.
أطلقت Midjourney رسميًا أول نموذج لها لتوليد الفيديو بالذكاء الاصطناعي، V1، مما يسمح لمستخدميها البالغ عددهم 20 مليونًا بتحويل الصور إلى مقاطع مدتها 5 ثوانٍ، قابلة للتمديد حتى 20 ثانية. يتكامل هذا العرض الجديد بسلاسة مع سير عمل Midjourney الحالي القائم على الصور، مما يتيح للمستخدمين تحويل الصور الثابتة التي تم إنشاؤها أو تحميلها إلى محتوى فيديو ديناميكي. يدعم النموذج تعديلات من الصورة إلى الفيديو ومن النص إلى الفيديو، مما يوفر أوضاع حركة منخفضة وعالية لتأثيرات رسوم متحركة متنوعة.
تتيح Midjourney إمكانيات توليد الفيديو الخاصة بها من خلال خطط الاشتراك الحالية، بدءًا من 10 دولارات شهريًا. بينما تكلف كل مهمة فيديو ما يقرب من ثمانية أضعاف مهمة توليد الصورة، فإن التكلفة لكل ثانية قابلة للمقارنة بتوليد صورة ثابتة واحدة. يبدو أن استراتيجية التسعير هذه تقلل من تكلفة العديد من المنافسين، مع اختبار "وضع الاسترخاء للفيديو" أيضًا للمشتركين المحترفين لتقليل تكاليف الحوسبة. وقد لاقى هذا السعر المعقول استحسان مجتمع المستخدمين.
على الرغم من دخولها الواعد، فإن نموذج V1 من Midjourney لديه قيود ملحوظة. فهو لا يولد حاليًا مسارات صوتية مصاحبة، مما يتطلب معالجة يدوية لاحقة للصوت. كما أن مخرجات الفيديو محدودة بـ 20 ثانية، ويفتقر النموذج إلى ميزات التحرير المتقدمة مثل الجداول الزمنية، أو انتقالات المشاهد، أو الاستمرارية بين المقاطع. ومع ذلك، ترى Midjourney هذا الإصدار الأولي كخطوة أولى استكشافية وقابلة للتطوير نحو هدف أكثر طموحًا: "نموذج عالمي". تهدف هذه الرؤية طويلة المدى إلى دمج توليد الصور الثابتة، والحركة المتحركة، والتنقل المكاني ثلاثي الأبعاد، والعرض في الوقت الفعلي في نظام موحد، مما يسمح للمستخدمين بالتنقل في بيئات تفاعلية يتم إنشاؤها ديناميكيًا.
يأتي إطلاق نموذج الفيديو من Midjourney وسط تحدٍ قانوني كبير. رفعت ديزني ويونيفرسال دعوى قضائية شاملة لانتهاك حقوق الطبع والنشر، متهمة Midjourney بتدريب نماذجها على شخصيات محمية بحقوق الطبع والنشر دون ترخيص وتمكين توليد محتوى مشتق. وتذكر الدعوى القضائية على وجه التحديد خدمة الفيديو من Midjourney كمصدر محتمل للانتهاك المستقبلي. من المقرر أن تختبر هذه المعركة القانونية حدود قانون حقوق الطبع والنشر الأمريكي فيما يتعلق ببيانات تدريب الذكاء الاصطناعي والتحكم في المخرجات. في سوق الفيديو التنافسي بالذكاء الاصطناعي، تواجه Midjourney منافسين مثل Sora من OpenAI، و Veo من Google DeepMind، و Dream Machine من Luma Labs، والعديد منهم يقدمون ميزات أكثر تقدمًا مثل الصوت المتكامل وإمكانيات التحرير الشاملة.









