التكنولوجيا اليومية
·08/09/2025
بوسطن ديناميكس تدفع حدود الروبوتات الشبيهة بالبشر من خلال أحدث إصدار لها من أطلس. متجاوزةً الإنجازات البهلوانية البحتة، تركز الشركة على المهام العملية اليومية، مستفيدةً من نظام تدريب متطور يعتمد بشكل كبير على المدخلات البشرية ونماذج الذكاء الاصطناعي المتقدمة. يمثل هذا التحول خطوة كبيرة نحو إنشاء روبوتات قادرة على التلاعب المعقد في العالم الحقيقي والاستخدامات العامة.
بينما عرضت عروض أطلس السابقة حركات بهلوانية مثيرة للإعجاب، يركز الاهتمام الحالي على مهام أكثر واقعية مثل نقل قطع غيار السيارات والحاويات. يوضح سكوت كويندرزما، نائب رئيس أبحاث الروبوتات في بوسطن ديناميكس، أن جعل الروبوت الشبيه بالبشر يؤدي مهام مفيدة باستمرار بأمان واقتصاد يمثل تحديًا كبيرًا. تهدف الشراكة مع معهد تويوتا للأبحاث إلى "تعميم استخدام" أطلس، والانتقال نحو روبوتات يمكنها التكيف وأداء مجموعة متنوعة من المهام، بدلاً من أن تكون متخصصة بشكل صارم.
يكمن جوهر هذا النهج الجديد في نماذج السلوك الكبيرة (LBMs)، التي تجمع بين المعرفة العالمية الواسعة والمعرفة المحددة بالمهام لتعزيز قدرة أطلس على التكيف. تقوم هذه الطريقة، وهي شكل من أشكال التعلم بالمحاكاة، بتدريب شبكة عصبية على بيانات العرض التوضيحي التي تم جمعها من خلال التشغيل عن بعد. يقوم المشغلون، المجهزون بأنظمة تتبع الحركة، بتوجيه أطلس عبر المهام، مما يخلق تخطيطًا واحدًا لواحد، والذي على الرغم من كونه بديهيًا، يتطلب ممارسة.
تُستخدم هذه البيانات، التي تتكون من صور كاميرا الروبوت، وأوصاف المهام باللغة الطبيعية، والإدراك الحسي، لتدريب الشبكة على إعادة إنتاج السلوكيات المرصودة. من خلال جمع البيانات من مهام متنوعة وحتى تجسيدات روبوتية مختلفة، يهدف إلى تحسين قدرات التعميم للنموذج. يتم تكييف النظام على اللغة، مما يسمح للبشر أو نماذج اللغة بتعليق البيانات بأوصاف. وهذا يمكّن المستخدمين من توجيه أطلس باللغة الإنجليزية، على أمل أن يتمكن من أداء المهمة حتى لو تطلبت براعة تتجاوز مجرد الالتقاط والوضع البسيط.
بينما يعد التعلم بالمحاكاة أمرًا أساسيًا، تقر بوسطن ديناميكس بأن أطلس يمتلك قدرات تتجاوز القيود البشرية، مثل الدوران المستمر للمفاصل. لدمج هذه القدرات، يستكشفون التدريب المشترك لنماذج السلوك الكبيرة (LBMs) مع مصادر بيانات تتجاوز التشغيل عن بعد، بما في ذلك بيانات المحاكاة من سياسات التعلم المعزز أو المخططين البرمجيين. وقد أظهر هذا النهج الهجين بالفعل وعدًا في تحسين أداء الروبوت في العالم الحقيقي.
تستخدم بوسطن ديناميكس استراتيجية "هرم البيانات"، مع إعطاء الأولوية للبيانات عالية الجودة الموجودة على الروبوت (قمة الهرم) التي يتم الحصول عليها من خلال التشغيل عن بعد. بينما تقر بضرورة بيانات المحاكاة والبيانات الاصطناعية (المستويات الأدنى من الهرم)، فإنها تحافظ على نهج متوازن، معتقدة أن كمية كبيرة من البيانات الواقعية الموجودة على الروبوت أمر بالغ الأهمية للنماذج لترجمة السلوكيات المتعلمة بفعالية إلى التجسيد المحدد للروبوت. تعمل الشركة أيضًا على تطوير عمليات قابلة للتكرار لتعزيز متانة السياسة، مع إمكانية دمج التعلم المعزز في المستقبل.









