معيار OpenAI الجديد يكشف عن كفاءة الذكاء الاصطناعي المتزايدة في مهام العمل الواقعية

التكنولوجيا اليومية

التكنولوجيا اليومية

·

01/10/2025

button icon
ADVERTISEMENT

قدمت OpenAI معيارًا جديدًا، GDPval، مصممًا لتقييم أداء الذكاء الاصطناعي في المهام ذات القيمة الاقتصادية والواقعية في مختلف المهن. تهدف هذه المبادرة إلى ترسيخ المناقشات حول الذكاء الاصطناعي في مكان العمل بأدلة ملموسة، ومعالجة المخاوف من أن العديد من الشركات لا ترى عوائد كبيرة على استثماراتها في الذكاء الاصطناعي.

النقاط الرئيسية

معيار GDPval

تم تطوير معيار GDPval (قيمة الناتج المحلي الإجمالي) الخاص بـ OpenAI لسد الفجوة بين أداء الذكاء الاصطناعي في المشكلات النظرية وفائدته في سيناريوهات العمل العملية. يستمد التقييم المهام من المهن الرئيسية داخل الصناعات التي تساهم بشكل كبير في الناتج المحلي الإجمالي للولايات المتحدة، مثل العقارات والحكومة والتصنيع والمالية. تم تجنيد متخصصين بمتوسط ​​14 عامًا من الخبرة لتصميم مهام واقعية وتقديم أمثلة مكتوبة من قبل الإنسان لإكمال المهام بنجاح. تتراوح هذه المهام من صياغة المذكرات القانونية والمخططات الهندسية إلى إدارة تفاعلات دعم العملاء وإنشاء خطط الرعاية التمريضية.

ADVERTISEMENT

رؤى حول أداء الذكاء الاصطناعي

كشفت الاختبارات الأولية باستخدام GDPval على 220 مهمة أن نماذج الذكاء الاصطناعي الرائدة تقترب من جودة المستوى البشري في العديد من المجالات. حقق Claude Opus 4.1 أعلى معدل فوز وتعادل بنسبة 47.6٪ مقابل المهام المكتملة من قبل الإنسان، متفوقًا في مجالات مثل تنسيق المستندات وتخطيط الشرائح. تبع ذلك GPT-5 high بمعدل فوز وتعادل بنسبة 38.8٪، مما يدل على القوة في الدقة واتباع التعليمات. سجل GPT-4o نسبة 12.4٪. كان أداء نماذج الذكاء الاصطناعي جيدًا بشكل خاص في أدوار مثل العدادين وموظفي الإيجار، وموظفي الشحن والمخزون، ومديري المبيعات، ومطوري البرامج. وعلى العكس من ذلك، واجهوا المزيد من التحديات في المهام من المهندسين الصناعيين والصيادلة والمديرين الماليين ومحرري الفيديو.

ADVERTISEMENT

السرعة والتكلفة ومستقبل العمل

بالإضافة إلى الجودة، تدعي OpenAI أن نماذج الذكاء الاصطناعي هذه يمكنها إكمال مهام GDPval أسرع بحوالي 100 مرة وبتكلفة أقل 100 مرة من الخبراء البشريين. على الرغم من هذه القدرات الرائعة، تؤكد OpenAI أن الذكاء الاصطناعي من غير المرجح أن يحل محل العمال البشريين بالكامل. تقترح الشركة أن دور الذكاء الاصطناعي سيكون التعامل مع المهام الروتينية، مما يسمح للمهنيين البشريين بالتركيز بشكل أكبر على الجوانب الإبداعية والاستراتيجية والقائمة على الحكم في عملهم، وبالتالي تعزيز الإنتاجية الإجمالية والرضا الوظيفي.

قراءة مقترحة

05-01-2026
مقارنة Asus ROG Swift PG27UCWM: الابتكارات التقنية وتأثير الأداء
اكتشف لوحة Asus ROG Swift PG27UCWM المتطورة Tandem WOLED مقاس 27 بوصة بدقة 4K، وتصميم شريط RGB، وأداء من الدرجة الأولى في هذه المراجعة المقارنة.
ADVERTISEMENT
01-09-2025
تنبيه لمستخدمي Gmail: جوجل تصدر تحذيرًا أمنيًا عاجلاً وسط تصاعد هجمات التصيد الاحتيالي
تصدر جوجل تحذيرًا أمنيًا عاجلاً لـ 2.5 مليار مستخدم لـ Gmail بعد اختراق البيانات، وتفصل التغييرات الهامة في القواعد واستراتيجيات التخفيف من هجمات التصيد الاحتيالي.
03-12-2025
نماذج ميسترال ميسترال 3: مقارنة ابتكار الذكاء الاصطناعي مفتوح الوزن مع شركات التكنولوجيا الكبرى
نماذج ميسترال 3 الجديدة من ميسترال تنافس شركات التكنولوجيا الكبرى بقدرات مفتوحة الوزن ومتعددة الوسائط، وأداء محسّن، وتطبيقات واسعة للمؤسسات.
30-09-2025
ابتكارات الروبوتات في معهد KAIST تحدث ثورة في الصناعات الكورية
يتم نشر روبوتات KAIST المتقدمة في أحواض بناء السفن في كوريا الجنوبية ومنطقة جانجنام، لعرض الابتكارات في الأتمتة الصناعية والخدمات الحضرية.
ADVERTISEMENT
06-01-2026
الاتجاهات الرئيسية التي تشكل النظارات الذكية القابلة للارتداء في عام 2026
استكشف الاتجاهات الرئيسية التي تدفع النظارات الذكية في عام 2026: المساعدون المدعومون بالذكاء الاصطناعي، والتصميمات خفيفة الوزن، وابتكار الشاشات، والتسعير - بناءً على عمليات الإطلاق الحقيقية في الصناعة.
11-08-2025
احذف تطبيقات VPN عالية المخاطر هذه من هاتفك الآيفون والأندرويد الآن
اكتشف تطبيقات VPN المجانية عالية المخاطر على جهاز iPhone و Android والتي قد تعرض خصوصية بياناتك للخطر. تعرف على التطبيقات التي يجب حذفها فورًا.
22-08-2025
تم إلغاء خطط بيكسل تابلت 2 والخاتم الذكي بواسطة جوجل
مسؤولون تنفيذيون في جوجل يؤكدون عدم وجود خطط لجهاز Pixel Tablet 2 أو خاتم ذكي، مع تحويل التركيز إلى الهواتف والأجهزة المتصلة الأخرى.
ADVERTISEMENT
25-11-2025
أفضل 10 اتجاهات رئيسية في تطبيقات الذكاء الاصطناعي للصحة النفسية بحلول عام 2025
استكشف أفضل 10 اتجاهات في الذكاء الاصطناعي والصحة النفسية بحلول عام 2025، بناءً على حالات واقعية واستراتيجيات الشركات. تعرف على كيفية تطور أدوات سلامة الذكاء الاصطناعي وأخلاقياته ودعمه.
05-01-2026
اتجاهات المنزل الذكي الرئيسية: المكانس الروبوتية الذكية وتنظيف المنزل من الجيل التالي
اكتشف أحدث اتجاهات التنظيف الذكي للمنزل: المكانس الروبوتية المدعومة بالذكاء الاصطناعي، والأوضاع المخصصة للحيوانات الأليفة والأطفال، وترقيات الأداء، والتصميم المستدام.
09-01-2026
الاتجاهات التقنية الرئيسية من Dell في معرض الإلكترونيات الاستهلاكية: ما يهم في عام 2026
استكشف أهم الاتجاهات التقنية التي كشفت عنها Dell في معرض CES 2026، بما في ذلك طبقات بيانات الذكاء الاصطناعي للمؤسسات، والذكاء الاصطناعي السيادي، والتحول بعيدًا عن أجهزة الكمبيوتر المدعومة بالذكاء الاصطناعي - مدعومة بأمثلة واقعية.
ADVERTISEMENT