الروبوتات تتعلم الآن التحدث من خلال مشاهدة يوتيوب

التكنولوجيا اليومية

التكنولوجيا اليومية

·

13/03/2026

button icon
ADVERTISEMENT

يظهر مجال جديد في الذكاء الاصطناعي، ليس من خلال الأكواد المعقدة، بل من خلال الملاحظة البسيطة. طور باحثون في جامعة كولومبيا للهندسة رأسًا آليًا اسمه EMO تعلم التحدث والغناء بالتزامن مع الكلام البشري، وذلك ببساطة من خلال مشاهدة مئات الساعات من مقاطع الفيديو على يوتيوب. يسلط هذا الإنجاز الضوء على عدة اتجاهات رئيسية تشكل مستقبل التفاعل بين الإنسان والروبوت.

التعلم بالملاحظة يتصدر المشهد

بدلاً من برمجتها بقواعد مكتوبة يدويًا لكل حركة فم، تتعلم الروبوتات الآن من خلال عملية مشابهة لكيفية تعلم البشر: بالمشاهدة والتقليد. يتضمن هذا النهج تدريب نموذج ذكاء اصطناعي على مجموعات بيانات ضخمة من المعلومات المرئية والصوتية. يتعلم النظام ربط أصوات معينة بحركات الوجه المقابلة المطلوبة لإنتاجها. هذه الطريقة تمثل تحولًا كبيرًا عن الروبوتات التقليدية، التي تعتمد على تعليمات صريحة ومحددة مسبقًا لكل إجراء.

ADVERTISEMENT

يمثل الروبوت EMO تجسيدًا لهذا الاتجاه. بدأ تدريبه بمرحلة اكتشاف الذات، حيث قام بحركات وجه عشوائية أمام مرآة لبناء خريطة داخلية لقدراته الخاصة. بعد ذلك، قام بمعالجة ساعات من مقاطع الفيديو عبر الإنترنت لأشخاص يتحدثون ويغنون. من خلال تحليل هذه البيانات إطارًا تلو الآخر، تعلم الذكاء الاصطناعي الخاص به التنبؤ بالأوامر الحركية الدقيقة اللازمة لتكرار حركات الشفاه الشبيهة بالبشر مباشرة من المدخلات الصوتية، وهي طريقة أثبتت فعاليتها أكثر من الأساليب الحالية.

الروبوتات اللينة تتغلب على "الوادي الغريب"

لجعل التفاعلات تبدو طبيعية، يجب أن تبدو الروبوتات مناسبة. يتجه الاتجاه بعيدًا عن المكونات الجامدة والميكانيكية نحو التصاميم اللينة والمرنة التي تحاكي البيولوجيا البشرية بشكل أفضل. هذه الروبوتات اللينة ضرورية لإنشاء تعابير دقيقة وسهلة الاقتراب، مما يساعد على سد "الوادي الغريب" الذي يجعل الروبوتات غالبًا ما تبدو مزعجة للبشر. هذا مهم بشكل خاص للتطبيقات التي تكون فيها الثقة والعلاقة ضرورية، مثل الرعاية الصحية أو التعليم أو خدمة العملاء.

ADVERTISEMENT

يتميز تصميم EMO بجلد سيليكون ناعم يغطي 26 مشغلًا تتحكم في حركات وجهه. هذا يسمح بدرجة عالية من الدقة، مما يمكّن الروبوت من تشكيل أصوات لـ 24 حرفًا ساكنًا و 16 حرفًا متحركًا. هذا يتناقض بشكل صارخ مع حركات الفك البسيطة المفتوحة والمغلقة للعديد من الروبوتات التقليدية، مما يسمح بتعابير وجه أكثر واقعية وأقل ترهيبًا. أظهرت الأبحاث السابقة مع EMO بالفعل أنه يمكنه عكس ابتسامة بشرية في الوقت الفعلي، مما يدل على قوة الوجوه المعبرة في بناء الثقة.

دمج الوجوه المعبرة مع الذكاء الاصطناعي الحواري

الهدف النهائي هو إنشاء روبوتات لا تستطيع التحدث فحسب، بل يمكنها أيضًا إجراء محادثات بطريقة جذابة للغاية. الاتجاه الرئيسي التالي هو دمج الروبوتات المعبرة جسديًا مع أنظمة الذكاء الاصطناعي الحوارية المتقدمة مثل ChatGPT أو Gemini. يمكن أن يؤدي الجمع بين مزامنة الشفاه الواقعية وتعابير الوجه مع القدرات اللغوية لهذه النماذج إلى خلق شعور عميق بالاتصال والحضور، مما يغير طريقة تفاعلنا مع الآلات.

ADVERTISEMENT

يرى الباحثون في مشروع EMO، بقيادة يوهانغ هو والبروفيسور هود ليبسون، أن هذا وسيلة لجعل التفاعلات تبدو أقل شبهاً بالتحدث إلى مكبر صوت ذكي وأكثر شبهاً بالتواصل مع كيان مجسد. جذب المشروع بالفعل دعمًا من المؤسسة الوطنية للعلوم الأمريكية وأمازون، مما يشير إلى أن القطاعين العام والخاص ينظران إلى الروبوتات المعبرة كتكنولوجيا قابلة للتطبيق تجاريًا وتحويلية. بينما لا تزال هناك قيود، فإن هذا الاندماج بين التقنيات هو عنصر أساسي لجعل التواصل بين الإنسان والروبوت جزءًا طبيعيًا من الحياة اليومية.

قراءة مقترحة

12-03-2026
تتطور سير عمل الذكاء الاصطناعي مع تكامل Claude المحسّن في Microsoft 365
اكتشف كيف تُنشئ آخر تحديثات Anthropic لـ Claude تكاملاً أعمق وأكثر سلاسة مع Microsoft Excel و PowerPoint، مما يُحدث تحولاً في سير العمل المدعوم بالذكاء الاصطناعي.
ADVERTISEMENT
13-03-2026
ظهور الروبوت العام يأخذ منعطفًا خاطئًا: الشرطة ترافق الآلة بعد إثارة ذعر سيدة مسنة
تم اصطحاب روبوت شبيه بالبشر في ماكاو من قبل الشرطة بعد أن فزع امرأة مسنة، مما أدى إلى دخولها المستشفى لفترة وجيزة وإثارة نقاش عبر الإنترنت حول سلامة الروبوتات في الأماكن العامة.
13-03-2026
المستثمرون الكوريون يستهدفون النظام البيئي الروبوتات البشرية في الصين
اكتشف لماذا يصب مستثمرو التجزئة في كوريا الجنوبية رؤوس أموالهم في صناديق المؤشرات المتداولة للروبوتات البشرية في الصين، مراهنين على هيمنتها في سلسلة التوريد على الرغم من تقليل المخاطر المؤسسية.
17-03-2026
NVIDIA DLSS 5 تهدف إلى الواقعية الفوتوغرافية مع التصيير بالذكاء الاصطناعي
تكشف NVIDIA عن تقنية DLSS 5 الجديدة المدعومة بالذكاء الاصطناعي لرفع الدقة، والتي تعد برسومات واقعية. استكشف كيف تقارن بالإصدارات السابقة وماذا يعني ذلك للألعاب.
ADVERTISEMENT
17-03-2026
ما وراء الشاشة: كيف يعيد الذكاء الاصطناعي والروبوتات تشكيل الترفيه
اكتشف اتجاهات التكنولوجيا الرئيسية التي تعيد تشكيل الترفيه، من اندماج الذكاء الاصطناعي والروبوتات إلى التطوير المدفوع بالمحاكاة، كما هو موضح في روبوت أولاف من ديزني وإنفيديا.
19-03-2026
الفصل التالي لشركة آبل: تحسينات رئيسية في نظام iOS 26.4
استكشف الاتجاهات الرئيسية التي كشف عنها تحديث iOS 26.4 من Apple، بما في ذلك الموسيقى المدعومة بالذكاء الاصطناعي، وأدوات المبدعين المتقدمة، وميزات إمكانية الوصول المحسنة.
20-03-2026
ما وراء المتصفح: صعود المساعدين المكتبيين للذكاء الاصطناعي الأصلي
استكشف التحول إلى تطبيقات سطح المكتب الأصلية للذكاء الاصطناعي بينما تتنافس Google Gemini و OpenAI ChatGPT و Anthropic Claude على مكان دائم على سطح مكتبك.
ADVERTISEMENT
23-03-2026
تلفزيون آبل وجهاز HomePod Mini الجديد من آبل ينتظران تحديث سيري قبل الإطلاق
جهاز Apple TV 4K الجديد من Apple وجهاز HomePod mini جاهزان ولكنهما متأخران، في انتظار إطلاق ميزات Siri المخصصة وApple Intelligence. تعرف على ترقيات الأجهزة المتوقعة ونافذة الإصدار.
25-03-2026
التطور التالي للبث: ما تكشفه أحدث خطوة لشركة Roku
استكشف التحولات الرئيسية في صناعة البث، بما في ذلك صعود المجمّعين الخارقين، والخدمات المتخصصة منخفضة التكلفة، وتوزيع المحتوى عبر المنصات.
25-03-2026
ميزة مقاطع الذكاء الاصطناعي الجديدة من سناب شات تحول الصور إلى مقاطع فيديو قصيرة
اكتشف ميزة مقاطع الذكاء الاصطناعي الجديدة من سناب شات التي تحول صورك إلى مقاطع فيديو جذابة مدتها 5 ثوانٍ تم إنشاؤها بواسطة الذكاء الاصطناعي، مما يوفر تجارب محتوى إبداعية وقابلة للمشاركة.
ADVERTISEMENT