الروبوتات تتعلم الآن التحدث من خلال مشاهدة يوتيوب

التكنولوجيا اليومية

التكنولوجيا اليومية

·

13/03/2026

button icon
ADVERTISEMENT

يظهر مجال جديد في الذكاء الاصطناعي، ليس من خلال الأكواد المعقدة، بل من خلال الملاحظة البسيطة. طور باحثون في جامعة كولومبيا للهندسة رأسًا آليًا اسمه EMO تعلم التحدث والغناء بالتزامن مع الكلام البشري، وذلك ببساطة من خلال مشاهدة مئات الساعات من مقاطع الفيديو على يوتيوب. يسلط هذا الإنجاز الضوء على عدة اتجاهات رئيسية تشكل مستقبل التفاعل بين الإنسان والروبوت.

التعلم بالملاحظة يتصدر المشهد

بدلاً من برمجتها بقواعد مكتوبة يدويًا لكل حركة فم، تتعلم الروبوتات الآن من خلال عملية مشابهة لكيفية تعلم البشر: بالمشاهدة والتقليد. يتضمن هذا النهج تدريب نموذج ذكاء اصطناعي على مجموعات بيانات ضخمة من المعلومات المرئية والصوتية. يتعلم النظام ربط أصوات معينة بحركات الوجه المقابلة المطلوبة لإنتاجها. هذه الطريقة تمثل تحولًا كبيرًا عن الروبوتات التقليدية، التي تعتمد على تعليمات صريحة ومحددة مسبقًا لكل إجراء.

ADVERTISEMENT

يمثل الروبوت EMO تجسيدًا لهذا الاتجاه. بدأ تدريبه بمرحلة اكتشاف الذات، حيث قام بحركات وجه عشوائية أمام مرآة لبناء خريطة داخلية لقدراته الخاصة. بعد ذلك، قام بمعالجة ساعات من مقاطع الفيديو عبر الإنترنت لأشخاص يتحدثون ويغنون. من خلال تحليل هذه البيانات إطارًا تلو الآخر، تعلم الذكاء الاصطناعي الخاص به التنبؤ بالأوامر الحركية الدقيقة اللازمة لتكرار حركات الشفاه الشبيهة بالبشر مباشرة من المدخلات الصوتية، وهي طريقة أثبتت فعاليتها أكثر من الأساليب الحالية.

الروبوتات اللينة تتغلب على "الوادي الغريب"

لجعل التفاعلات تبدو طبيعية، يجب أن تبدو الروبوتات مناسبة. يتجه الاتجاه بعيدًا عن المكونات الجامدة والميكانيكية نحو التصاميم اللينة والمرنة التي تحاكي البيولوجيا البشرية بشكل أفضل. هذه الروبوتات اللينة ضرورية لإنشاء تعابير دقيقة وسهلة الاقتراب، مما يساعد على سد "الوادي الغريب" الذي يجعل الروبوتات غالبًا ما تبدو مزعجة للبشر. هذا مهم بشكل خاص للتطبيقات التي تكون فيها الثقة والعلاقة ضرورية، مثل الرعاية الصحية أو التعليم أو خدمة العملاء.

ADVERTISEMENT

يتميز تصميم EMO بجلد سيليكون ناعم يغطي 26 مشغلًا تتحكم في حركات وجهه. هذا يسمح بدرجة عالية من الدقة، مما يمكّن الروبوت من تشكيل أصوات لـ 24 حرفًا ساكنًا و 16 حرفًا متحركًا. هذا يتناقض بشكل صارخ مع حركات الفك البسيطة المفتوحة والمغلقة للعديد من الروبوتات التقليدية، مما يسمح بتعابير وجه أكثر واقعية وأقل ترهيبًا. أظهرت الأبحاث السابقة مع EMO بالفعل أنه يمكنه عكس ابتسامة بشرية في الوقت الفعلي، مما يدل على قوة الوجوه المعبرة في بناء الثقة.

دمج الوجوه المعبرة مع الذكاء الاصطناعي الحواري

الهدف النهائي هو إنشاء روبوتات لا تستطيع التحدث فحسب، بل يمكنها أيضًا إجراء محادثات بطريقة جذابة للغاية. الاتجاه الرئيسي التالي هو دمج الروبوتات المعبرة جسديًا مع أنظمة الذكاء الاصطناعي الحوارية المتقدمة مثل ChatGPT أو Gemini. يمكن أن يؤدي الجمع بين مزامنة الشفاه الواقعية وتعابير الوجه مع القدرات اللغوية لهذه النماذج إلى خلق شعور عميق بالاتصال والحضور، مما يغير طريقة تفاعلنا مع الآلات.

ADVERTISEMENT

يرى الباحثون في مشروع EMO، بقيادة يوهانغ هو والبروفيسور هود ليبسون، أن هذا وسيلة لجعل التفاعلات تبدو أقل شبهاً بالتحدث إلى مكبر صوت ذكي وأكثر شبهاً بالتواصل مع كيان مجسد. جذب المشروع بالفعل دعمًا من المؤسسة الوطنية للعلوم الأمريكية وأمازون، مما يشير إلى أن القطاعين العام والخاص ينظران إلى الروبوتات المعبرة كتكنولوجيا قابلة للتطبيق تجاريًا وتحويلية. بينما لا تزال هناك قيود، فإن هذا الاندماج بين التقنيات هو عنصر أساسي لجعل التواصل بين الإنسان والروبوت جزءًا طبيعيًا من الحياة اليومية.

قراءة مقترحة

14-11-2025
قفزة في الروبوتات الشبيهة بالبشر: تحسين الحركة في الوقت الفعلي
قفزة في الروبوتات الشبيهة بالبشر: تحسين الحركة في الوقت الفعلي
ADVERTISEMENT
05-08-2025
اختبارات أرضية قد تفسر لماذا تتعثر مركبات المريخ الجوالة
اكتشف كيف أن الاختبارات الأرضية المعيبة، وتحديداً إغفال تأثير الجاذبية على الرمال، قد يفسر لماذا تعلق عربات ناسا الجوالة على المريخ.
25-08-2025
آبل تتطلع إلى جوجل جيميني لإصلاح شامل لسيري بالذكاء الاصطناعي
يُقال إن شركة آبل تجري محادثات مع جوجل لدمج Gemini AI في سيري لترقية كبيرة متوقعة في عام 2026، مستكشفة شراكات خارجية وسط مشهد الذكاء الاصطناعي المتغير.
05-08-2025
إنتل تستعد لتحدي AMD في سوق أجهزة الكمبيوتر المحمولة المخصصة للألعاب
معالجات إنتل المحمولة القادمة تظهر أداءً تنافسيًا ضد أحدث شرائح AMD في اختبارات الأداء المسربة، مما قد يضع إنتل كلاعب رئيسي في الجيل القادم من أجهزة الكمبيوتر المحمولة المخصصة للألعاب.
ADVERTISEMENT
20-10-2025
خصم هائل: لابتوب HP مقاس 15 بوصة مع قرص SSD بسعة 1 تيرابايت وذاكرة وصول عشوائي بسعة 32 جيجابايت بخصم 71% الآن على أمازون
اكتشف صفقة لا تصدق على كمبيوتر محمول HP بحجم 15.6 بوصة مع ذاكرة وصول عشوائي (RAM) بسعة 32 جيجابايت ووحدة تخزين SSD بسعة 1 تيرابايت، بخصم 71% الآن على أمازون. تعرف على أدائه وشاشته واتصاله.
01-07-2025
هل يمكننا استخراج الذكريات من الموتى؟ علماء الأعصاب يجيبون
كشف استطلاع للعلماء الأعصاب عن اعتقاد كبير بأن الذكريات لها أساس مادي ويمكن استخلاصها من الأدمغة المحفوظة، مما يثير تساؤلات حول مستقبل الوعي.
09-10-2025
جوجل بيكسل بدز 2a: إلغاء ضوضاء نشط أقوى وقيمة أفضل، لكنها ليست ثورة في الصوت
تقدم سماعات Google Pixel Buds 2a ميزة إلغاء الضوضاء النشطة المحسنة، وعمر بطارية أطول، وراحة أفضل بسعر جذاب. تعرف على كيفية تفوقها في مراجعتنا الموجزة.
ADVERTISEMENT
05-12-2025
الاتجاهات الرئيسية في علاجات تساقط الشعر: ما يحتاج متخصصو الصناعة إلى معرفته
استكشف الاتجاهات الرئيسية في علاج تساقط الشعر: مثبطات الأندروجين الجديدة، العلاجات الموضعية المستهدفة، قاعدة متزايدة من المرضى، وإعادة توظيف الأدوية. رؤى سريعة مدعومة بالبيانات.
25-11-2025
نقل قوائم تشغيل سبوتيفاي: تغيير جذري لمحبي الموسيقى
تتيح ميزة نقل قوائم التشغيل المدمجة الجديدة في سبوتيفاي للمستخدمين نقل قوائم تشغيل غير محدودة من Apple Music و YouTube Music والمزيد، مما يعزز التخصيص على الفور.
17-11-2025
أبرز اتجاهات تكنولوجيا المستهلك التي يجب مراقبتها بحلول عام 2025
أبرز اتجاهات تكنولوجيا المستهلك التي يجب مراقبتها بحلول عام 2025
ADVERTISEMENT