التكنولوجيا اليومية
·08/12/2025
قدمت NVIDIA نظام DoorMan، وهو حل قائم على التعلم المعزز تم اختباره على الروبوت البشري Unitree G1. في تجارب مضبوطة، مكّن DoorMan الروبوت من فتح الأبواب بسرعة ونجاح أكبر من المشغلين البشريين عن بعد باستخدام نفس الأجهزة.
باستخدام كاميرات RGB مدمجة فقط وسياسات تم تدريبها في المحاكاة، حقق DoorMan معدل نجاح بنسبة 83٪ في فتح أبواب متنوعة في العالم الحقيقي، مقارنة بـ 80٪ للبشر الخبراء و 60٪ لغير الخبراء. كان فتح الأبواب بواسطة الروبوت أسرع بنسبة تصل إلى 31٪ من التشغيل البشري، مما يدل على قدرة متقدمة على الحركة والمناولة (المشي والتعامل مع الأشياء في وقت واحد). كان هذا الأداء ممكنًا دون مستشعرات متخصصة أو تعديل بعد التدريب.
على عكس التشغيل عن بعد التقليدي، الذي يعتمد على مهارة المستخدم وقيود الواجهة، تم تدريب سياسة روبوت DoorMan حصريًا في محاكاة Isaac Lab، باستخدام آلية إعادة تعيين مرحلية لتحسين تقدم التعلم. أتاح ذلك تدريبًا فعالًا على ملايين سيناريوهات الأبواب العشوائية - التي تتنوع فيها صلابة المفصلات، وعرض الأبواب، وأنواع المقابض، والأنسجة - مما يمنح DoorMan نطاقًا تشغيليًا أوسع مما يمكن للمشغلين اليدويين تعلمه من التجربة.
أحد الفروقات الرئيسية هو المدخلات الحسية: يعمل المشغلون البشريون عن بعد باستخدام واجهات الواقع الافتراضي التي توفر ردود فعل محدودة، مما يؤدي أحيانًا إلى أخطاء في تطبيق القوة أو التوازن. تعلم DoorMan، باستخدام مدخلات بصرية فقط، سلوكيات تكيفية مثل إعادة التموضع للحفاظ على رؤية المقبض، بفضل تحسين السياسة النسبية للمجموعة.
يسلط النجاح المقارن لـ DoorMan الضوء على قابلية التوسع والقدرة على التكيف للتعلم المعزز المدفوع بالمحاكاة في الروبوتات. من خلال ترجمة سياسات البكسل إلى إجراءات من المحاكاة بنجاح إلى أداء مادي دون إعادة تدريب، يضع هذا النهج معيارًا جديدًا لمهام المناولة البشرية. قد تؤدي القدرة على التعميم عبر بيئات العالم الحقيقي المتنوعة إلى تسريع نشر الروبوتات في البيئات الديناميكية حيث تكون المناولة المعممة أمرًا بالغ الأهمية.









