الروبوتات تتعلم الآن التحدث من خلال مشاهدة يوتيوب

التكنولوجيا اليومية

التكنولوجيا اليومية

·

13/03/2026

button icon
ADVERTISEMENT

يظهر مجال جديد في الذكاء الاصطناعي، ليس من خلال الأكواد المعقدة، بل من خلال الملاحظة البسيطة. طور باحثون في جامعة كولومبيا للهندسة رأسًا آليًا اسمه EMO تعلم التحدث والغناء بالتزامن مع الكلام البشري، وذلك ببساطة من خلال مشاهدة مئات الساعات من مقاطع الفيديو على يوتيوب. يسلط هذا الإنجاز الضوء على عدة اتجاهات رئيسية تشكل مستقبل التفاعل بين الإنسان والروبوت.

التعلم بالملاحظة يتصدر المشهد

بدلاً من برمجتها بقواعد مكتوبة يدويًا لكل حركة فم، تتعلم الروبوتات الآن من خلال عملية مشابهة لكيفية تعلم البشر: بالمشاهدة والتقليد. يتضمن هذا النهج تدريب نموذج ذكاء اصطناعي على مجموعات بيانات ضخمة من المعلومات المرئية والصوتية. يتعلم النظام ربط أصوات معينة بحركات الوجه المقابلة المطلوبة لإنتاجها. هذه الطريقة تمثل تحولًا كبيرًا عن الروبوتات التقليدية، التي تعتمد على تعليمات صريحة ومحددة مسبقًا لكل إجراء.

ADVERTISEMENT

يمثل الروبوت EMO تجسيدًا لهذا الاتجاه. بدأ تدريبه بمرحلة اكتشاف الذات، حيث قام بحركات وجه عشوائية أمام مرآة لبناء خريطة داخلية لقدراته الخاصة. بعد ذلك، قام بمعالجة ساعات من مقاطع الفيديو عبر الإنترنت لأشخاص يتحدثون ويغنون. من خلال تحليل هذه البيانات إطارًا تلو الآخر، تعلم الذكاء الاصطناعي الخاص به التنبؤ بالأوامر الحركية الدقيقة اللازمة لتكرار حركات الشفاه الشبيهة بالبشر مباشرة من المدخلات الصوتية، وهي طريقة أثبتت فعاليتها أكثر من الأساليب الحالية.

الروبوتات اللينة تتغلب على "الوادي الغريب"

لجعل التفاعلات تبدو طبيعية، يجب أن تبدو الروبوتات مناسبة. يتجه الاتجاه بعيدًا عن المكونات الجامدة والميكانيكية نحو التصاميم اللينة والمرنة التي تحاكي البيولوجيا البشرية بشكل أفضل. هذه الروبوتات اللينة ضرورية لإنشاء تعابير دقيقة وسهلة الاقتراب، مما يساعد على سد "الوادي الغريب" الذي يجعل الروبوتات غالبًا ما تبدو مزعجة للبشر. هذا مهم بشكل خاص للتطبيقات التي تكون فيها الثقة والعلاقة ضرورية، مثل الرعاية الصحية أو التعليم أو خدمة العملاء.

ADVERTISEMENT

يتميز تصميم EMO بجلد سيليكون ناعم يغطي 26 مشغلًا تتحكم في حركات وجهه. هذا يسمح بدرجة عالية من الدقة، مما يمكّن الروبوت من تشكيل أصوات لـ 24 حرفًا ساكنًا و 16 حرفًا متحركًا. هذا يتناقض بشكل صارخ مع حركات الفك البسيطة المفتوحة والمغلقة للعديد من الروبوتات التقليدية، مما يسمح بتعابير وجه أكثر واقعية وأقل ترهيبًا. أظهرت الأبحاث السابقة مع EMO بالفعل أنه يمكنه عكس ابتسامة بشرية في الوقت الفعلي، مما يدل على قوة الوجوه المعبرة في بناء الثقة.

دمج الوجوه المعبرة مع الذكاء الاصطناعي الحواري

الهدف النهائي هو إنشاء روبوتات لا تستطيع التحدث فحسب، بل يمكنها أيضًا إجراء محادثات بطريقة جذابة للغاية. الاتجاه الرئيسي التالي هو دمج الروبوتات المعبرة جسديًا مع أنظمة الذكاء الاصطناعي الحوارية المتقدمة مثل ChatGPT أو Gemini. يمكن أن يؤدي الجمع بين مزامنة الشفاه الواقعية وتعابير الوجه مع القدرات اللغوية لهذه النماذج إلى خلق شعور عميق بالاتصال والحضور، مما يغير طريقة تفاعلنا مع الآلات.

ADVERTISEMENT

يرى الباحثون في مشروع EMO، بقيادة يوهانغ هو والبروفيسور هود ليبسون، أن هذا وسيلة لجعل التفاعلات تبدو أقل شبهاً بالتحدث إلى مكبر صوت ذكي وأكثر شبهاً بالتواصل مع كيان مجسد. جذب المشروع بالفعل دعمًا من المؤسسة الوطنية للعلوم الأمريكية وأمازون، مما يشير إلى أن القطاعين العام والخاص ينظران إلى الروبوتات المعبرة كتكنولوجيا قابلة للتطبيق تجاريًا وتحويلية. بينما لا تزال هناك قيود، فإن هذا الاندماج بين التقنيات هو عنصر أساسي لجعل التواصل بين الإنسان والروبوت جزءًا طبيعيًا من الحياة اليومية.

قراءة مقترحة

03-02-2026
ما يمكن توقعه من ترقيات MacBook Pro القادمة من Apple
تستعد آبل لطرح طرازات جديدة من أجهزة ماك بوك برو مزودة بشرائح M5 Pro و M5 Max ونظام التشغيل MacOS 26.3. استكشف الاتجاهات والميزات الرئيسية والتأثيرات الصناعية في أقل من 600 كلمة.
ADVERTISEMENT
20-11-2025
أدوات وقت الشاشة الجديدة من تيك توك للمراهقين: مقارنة تقنية لحلول الرفاهية الرقمية القياسية
مقارنة أدوات وقت الشاشة الجديدة للمراهقين من تيك توك مع أدوات الرقابة الأبوية القياسية، مع التركيز على الأداء التقني ورفاهية المستخدم الرقمية المتمحورة حول المستخدم.
25-07-2025
الروبوت الشبيه بالبشر ديريك يخرج عن السيطرة في مختبر سان فرانسيسكو، مما يثير جنونًا فيروسيًا
يُظهر مقطع فيديو فيروسي الروبوت الشبيه بالبشر ديريك وهو يخرج عن السيطرة في مختبر بسان فرانسيسكو، ويتحرك بعنف ويتسبب في انهيار رافعة. يلقي المبدع باللوم على خطأ بشري، مما يثير نقاشًا حول سلامة الذكاء الاصطناعي.
05-12-2025
من بقايا المطبخ إلى روائع روبوتية: النفايات الغذائية تحصل على حياة ثانية في تصميم المواد الحيوية
يقوم الباحثون بإنشاء روبوتات من النفايات الغذائية مثل الهياكل الخارجية لجراد البحر، مما يوضح مسارًا جديدًا لتصميم المواد الحيوية المستدامة في مجال الروبوتات مع أدوات معالجة ووحدات إمساك وروبوتات سباحة وظيفية.
ADVERTISEMENT
19-11-2025
تتحدى كاميرا DJI Osmo Action 6 كاميرا GoPro بميزات متقدمة، لكن التوفر في الولايات المتحدة غير مؤكد
تقدم كاميرا Osmo Action 6 الجديدة من DJI ميزات متقدمة مثل فتحة العدسة المتغيرة، مما يشكل تحديًا لـ GoPro، لكنها تواجه قيودًا على الاستيراد في الولايات المتحدة.
01-10-2025
مستقبل سامسونج القابل للطي: سلسلة Galaxy Z تحطم الأرقام القياسية للمبيعات
تحقق هواتف Samsung Galaxy Z Flip 7 و Z Fold 7 مبيعات قياسية، وتجذب عملاء جدد وتحول مستخدمي Samsung الحاليين إلى هواتف قابلة للطي، مما يشير إلى تزايد قبول السوق.
29-01-2026
نظرة عامة تقنية على شاحن سامسونج اللاسلكي بقوة 25 واط ومقارنته بحلول Qi2 الحالية
شاحن سامسونج اللاسلكي المغناطيسي الجديد بقوة 25 واط يوفر سرعات أعلى وتوافقًا أوسع مع Qi2، مما يرتقي بالشحن اللاسلكي لأجهزة Galaxy الرائدة.
ADVERTISEMENT
27-01-2026
تطور تصميم واجهة المستخدم: نهج أندرويد 17 الشفاف مقابل زجاج أبل السائل
نظرة مقارنة على تغييرات واجهة المستخدم الشفافة لأندرويد 17 مقابل تأثير الزجاج السائل من آبل، مع التركيز على التصميم والأداء وتجربة المستخدم.
12-06-2025
تلقى ChatGPT هزيمة: أتاري 2600 القديم يهزم الذكاء الاصطناعي الحديث في مواجهة الشطرنج
هزم ChatGPT في مباراة شطرنج من قبل جهاز أتاري 2600 من حقبة السبعينيات، مما يسلط الضوء على قيود نماذج اللغة في الألعاب الاستراتيجية.
18-08-2025
الرئيس التنفيذي لـ Duolingo يتناول جدل مذكرة الذكاء الاصطناعي، وينفي نوايا التسريح
يوضح لويس فون آن، الرئيس التنفيذي لشركة دوولينجو، استراتيجية الشركة "الذكاء الاصطناعي أولاً"، متناولاً المخاوف بشأن دوافع الربح والتسريحات المحتملة، ومؤكداً على إمكانات التكنولوجيا.
ADVERTISEMENT