معيار OpenAI الجديد يكشف عن كفاءة الذكاء الاصطناعي المتزايدة في مهام العمل الواقعية

التكنولوجيا اليومية

التكنولوجيا اليومية

·

01/10/2025

button icon
ADVERTISEMENT

قدمت OpenAI معيارًا جديدًا، GDPval، مصممًا لتقييم أداء الذكاء الاصطناعي في المهام ذات القيمة الاقتصادية والواقعية في مختلف المهن. تهدف هذه المبادرة إلى ترسيخ المناقشات حول الذكاء الاصطناعي في مكان العمل بأدلة ملموسة، ومعالجة المخاوف من أن العديد من الشركات لا ترى عوائد كبيرة على استثماراتها في الذكاء الاصطناعي.

النقاط الرئيسية

معيار GDPval

تم تطوير معيار GDPval (قيمة الناتج المحلي الإجمالي) الخاص بـ OpenAI لسد الفجوة بين أداء الذكاء الاصطناعي في المشكلات النظرية وفائدته في سيناريوهات العمل العملية. يستمد التقييم المهام من المهن الرئيسية داخل الصناعات التي تساهم بشكل كبير في الناتج المحلي الإجمالي للولايات المتحدة، مثل العقارات والحكومة والتصنيع والمالية. تم تجنيد متخصصين بمتوسط ​​14 عامًا من الخبرة لتصميم مهام واقعية وتقديم أمثلة مكتوبة من قبل الإنسان لإكمال المهام بنجاح. تتراوح هذه المهام من صياغة المذكرات القانونية والمخططات الهندسية إلى إدارة تفاعلات دعم العملاء وإنشاء خطط الرعاية التمريضية.

ADVERTISEMENT

رؤى حول أداء الذكاء الاصطناعي

كشفت الاختبارات الأولية باستخدام GDPval على 220 مهمة أن نماذج الذكاء الاصطناعي الرائدة تقترب من جودة المستوى البشري في العديد من المجالات. حقق Claude Opus 4.1 أعلى معدل فوز وتعادل بنسبة 47.6٪ مقابل المهام المكتملة من قبل الإنسان، متفوقًا في مجالات مثل تنسيق المستندات وتخطيط الشرائح. تبع ذلك GPT-5 high بمعدل فوز وتعادل بنسبة 38.8٪، مما يدل على القوة في الدقة واتباع التعليمات. سجل GPT-4o نسبة 12.4٪. كان أداء نماذج الذكاء الاصطناعي جيدًا بشكل خاص في أدوار مثل العدادين وموظفي الإيجار، وموظفي الشحن والمخزون، ومديري المبيعات، ومطوري البرامج. وعلى العكس من ذلك، واجهوا المزيد من التحديات في المهام من المهندسين الصناعيين والصيادلة والمديرين الماليين ومحرري الفيديو.

ADVERTISEMENT

السرعة والتكلفة ومستقبل العمل

بالإضافة إلى الجودة، تدعي OpenAI أن نماذج الذكاء الاصطناعي هذه يمكنها إكمال مهام GDPval أسرع بحوالي 100 مرة وبتكلفة أقل 100 مرة من الخبراء البشريين. على الرغم من هذه القدرات الرائعة، تؤكد OpenAI أن الذكاء الاصطناعي من غير المرجح أن يحل محل العمال البشريين بالكامل. تقترح الشركة أن دور الذكاء الاصطناعي سيكون التعامل مع المهام الروتينية، مما يسمح للمهنيين البشريين بالتركيز بشكل أكبر على الجوانب الإبداعية والاستراتيجية والقائمة على الحكم في عملهم، وبالتالي تعزيز الإنتاجية الإجمالية والرضا الوظيفي.

قراءة مقترحة

17-10-2025
أنثروبيك تكشف عن ميزات جديدة للذكاء الاصطناعي لتبسيط التسويق والعروض التقديمية
تقدم شركة Anthropic الناشئة في مجال الذكاء الاصطناعي ميزات جديدة مثل "المهارات" و"البحث المؤسسي" لتعزيز الإنتاجية في التسويق والعروض التقديمية واسترجاع المعلومات باستخدام نموذج Claude للذكاء الاصطناعي الخاص بها.
ADVERTISEMENT
04-12-2025
أطلقت أوبر خدمة الروبوت تاكسي في دالاس، مع وجود سائق بشري خلف عجلة القيادة... في الوقت الحالي
أطلقت أوبر خدمة الروبوتكسي الخاصة بها في دالاس، تكساس، مع إشراف بشري في البداية. تعرف على منطقة الخدمة، والتسعير، وخطط أوبر المستقبلية في سوق المركبات ذاتية القيادة التنافسي.
28-11-2025
أفضل 10 اتجاهات في الروبوتات الشبيهة بالبشر لمراقبتها بحلول عام 2025
اكتشف 10 اتجاهات رئيسية في مجال الروبوتات البشرية بحلول عام 2025، مع تطورات واقعية في الذكاء الاصطناعي، والنمطية، والاستقلالية، وحالات الاستخدام الصناعية مثل A2 من Agibot الحائز على الأرقام القياسية.
30-05-2025
Hermès تطلق سماعات رأس فاخرة بسعر 15,000 دولار
تطلق Hermès سماعات رأس فاخرة بسعر 15,000 دولار، تتميز بجلد البقر المخيط يدويًا وتصميم أنيق. اكتشف المزيد عن هذه التحفة الصوتية.
ADVERTISEMENT
26-11-2025
طائرة ناسا النفاثة الأسرع من الصوت X-59 تحلق: عصر جديد من السرعة الهادئة
استرجع الرحلة الأولى لطائرة ناسا النفاثة الأسرع من الصوت الهادئة X-59 مع فيديو مثير ومقال مفصل. تعرف على تصميمها المبتكر وإمكانياتها المستقبلية للسفر الجوي التجاري.
30-09-2025
عودة رعب اللقطات المصورة: عرض فيلم 'Shelby Oaks' الترويجي يعد بغموض مثير
استكشف المقطع الدعائي المروع والنجاح التمويلي لفيلم "Shelby Oaks"، وهو فيلم رعب جديد بأسلوب اللقطات التي عُثر عليها من إخراج كريس ستاكمان، ومن المقرر إصداره في 24 أكتوبر.
09-09-2025
شاهد الرقصة السماوية: خسوف قمري كلي يزين سماء الليل
تعرف على كل شيء عن الخسوف الكلي للقمر الذي يحدث الليلة، بما في ذلك مراحله، وتأثير "القمر الدموي"، وإمكانية الرؤية، وكيفية مشاهدة هذا الحدث الفلكي النادر.
ADVERTISEMENT
15-08-2025
ثورة أبل في الذكاء الاصطناعي: الروبوتات، والأجهزة القابلة للطي، وسيري أكثر ذكاءً في الأفق
يُقال إن شركة آبل تستعد لإطلاق موجة من المنتجات المدعومة بالذكاء الاصطناعي، بما في ذلك روبوتات متقدمة، وسيري نابضة بالحياة، وأجهزة قابلة للطي، بهدف تعزيز ثقة المستثمرين وتحسين تجربة المستخدم.
10-11-2025
روبوت "آيرون" من XPeng: إعادة تعريف القدرات البشرية
Iron" الجديد الشبيه بالبشر من XPeng يضع معيارًا صناعيًا جديدًا بمشيته الواقعية بشكل لا يصدق ودمج أول بطارية حالة صلبة بالكامل في روبوت شبيه بالبشر، مما يعزز السلامة والأداء لتطبيقات المستهلك المستقبلية
09-10-2025
المواجهات بين الهواتف الرائدة القابلة للطي: سامسونج جالاكسي زد فولد 7 مقابل جوجل بيكسل 10 برو فولد
يذهب Samsung Galaxy Z Fold 7 و Google Pixel 10 Pro Fold وجهاً لوجه في مراجعتنا الشاملة. اكتشف أي هاتف رائد قابل للطي يتصدر القائمة في عام 2024 من حيث التصميم والميزات والقيمة الإجمالية.
ADVERTISEMENT