معيار OpenAI الجديد يكشف عن كفاءة الذكاء الاصطناعي المتزايدة في مهام العمل الواقعية

التكنولوجيا اليومية

التكنولوجيا اليومية

·

01/10/2025

button icon
ADVERTISEMENT

قدمت OpenAI معيارًا جديدًا، GDPval، مصممًا لتقييم أداء الذكاء الاصطناعي في المهام ذات القيمة الاقتصادية والواقعية في مختلف المهن. تهدف هذه المبادرة إلى ترسيخ المناقشات حول الذكاء الاصطناعي في مكان العمل بأدلة ملموسة، ومعالجة المخاوف من أن العديد من الشركات لا ترى عوائد كبيرة على استثماراتها في الذكاء الاصطناعي.

النقاط الرئيسية

معيار GDPval

تم تطوير معيار GDPval (قيمة الناتج المحلي الإجمالي) الخاص بـ OpenAI لسد الفجوة بين أداء الذكاء الاصطناعي في المشكلات النظرية وفائدته في سيناريوهات العمل العملية. يستمد التقييم المهام من المهن الرئيسية داخل الصناعات التي تساهم بشكل كبير في الناتج المحلي الإجمالي للولايات المتحدة، مثل العقارات والحكومة والتصنيع والمالية. تم تجنيد متخصصين بمتوسط ​​14 عامًا من الخبرة لتصميم مهام واقعية وتقديم أمثلة مكتوبة من قبل الإنسان لإكمال المهام بنجاح. تتراوح هذه المهام من صياغة المذكرات القانونية والمخططات الهندسية إلى إدارة تفاعلات دعم العملاء وإنشاء خطط الرعاية التمريضية.

ADVERTISEMENT

رؤى حول أداء الذكاء الاصطناعي

كشفت الاختبارات الأولية باستخدام GDPval على 220 مهمة أن نماذج الذكاء الاصطناعي الرائدة تقترب من جودة المستوى البشري في العديد من المجالات. حقق Claude Opus 4.1 أعلى معدل فوز وتعادل بنسبة 47.6٪ مقابل المهام المكتملة من قبل الإنسان، متفوقًا في مجالات مثل تنسيق المستندات وتخطيط الشرائح. تبع ذلك GPT-5 high بمعدل فوز وتعادل بنسبة 38.8٪، مما يدل على القوة في الدقة واتباع التعليمات. سجل GPT-4o نسبة 12.4٪. كان أداء نماذج الذكاء الاصطناعي جيدًا بشكل خاص في أدوار مثل العدادين وموظفي الإيجار، وموظفي الشحن والمخزون، ومديري المبيعات، ومطوري البرامج. وعلى العكس من ذلك، واجهوا المزيد من التحديات في المهام من المهندسين الصناعيين والصيادلة والمديرين الماليين ومحرري الفيديو.

ADVERTISEMENT

السرعة والتكلفة ومستقبل العمل

بالإضافة إلى الجودة، تدعي OpenAI أن نماذج الذكاء الاصطناعي هذه يمكنها إكمال مهام GDPval أسرع بحوالي 100 مرة وبتكلفة أقل 100 مرة من الخبراء البشريين. على الرغم من هذه القدرات الرائعة، تؤكد OpenAI أن الذكاء الاصطناعي من غير المرجح أن يحل محل العمال البشريين بالكامل. تقترح الشركة أن دور الذكاء الاصطناعي سيكون التعامل مع المهام الروتينية، مما يسمح للمهنيين البشريين بالتركيز بشكل أكبر على الجوانب الإبداعية والاستراتيجية والقائمة على الحكم في عملهم، وبالتالي تعزيز الإنتاجية الإجمالية والرضا الوظيفي.

قراءة مقترحة

11-08-2025
iOS 26: الكشف عن ثلاث ميزات خفية
اكتشف ثلاثة ميزات خفية في iOS 26: وضع الطاقة التكيفي لتحسين عمر البطارية، جواز سفر أمريكي رقمي في Apple Wallet، وبث الفيديو عبر AirPlay لـ CarPlay.
ADVERTISEMENT
18-11-2025
آبل تشاع أنها تطور أغطية آيفون بواجهات لمس ثانوية
يُشاع أن شركة آبل تعمل على تطوير أغطية مبتكرة لهواتف آيفون مع واجهات لمس ثانوية مدمجة، بهدف تعزيز تجربة 'برو' لطرازات هواتفها الذكية المتميزة.
27-11-2025
ازدهار الذكاء الاصطناعي يرفع التكاليف على لاعبي الألعاب وعشاق أجهزة الكمبيوتر
اكتشف لماذا أدى ازدهار الذكاء الاصطناعي إلى ارتفاع كبير في أسعار ذاكرة الوصول العشوائي (RAM) ومحركات الأقراص ذات الحالة الثابتة (SSDs)، مما جعل ترقيات الألعاب وأجهزة الكمبيوتر أكثر تكلفة من أي وقت مضى.
21-05-2025
تجربة ميزة "جربها" الجديدة من جوجل: ممتعة ومضحكة
استكشف تجربة ميزة "جربها" الجديدة من جوجل، التي تستخدم الذكاء الاصطناعي لمساعدتك في تجربة الملابس افتراضيًا. تعرف على كيفية عملها ونتائجها المضحكة.
ADVERTISEMENT
01-10-2025
شريحة M5 من Apple: ترقية طفيفة مقارنة بشريحة M4، الكشف عن مواصفات iPad Pro الجديد
تتم مقارنة شريحة M5 من Apple بشريحة M4، مما يكشف عن ترقيات طفيفة في المواصفات بما في ذلك زيادة ذاكرة التخزين المؤقت L2 وذاكرة الوصول العشوائي (RAM) في طرز iPad Pro الجديدة.
09-10-2025
دراسة جديدة تربط حتى العادة المعتدلة لشرب المشروبات الغازية بزيادة خطر الإصابة بأمراض الكبد
تكشف دراسة جديدة أن شرب حتى أقل من عبوة صودا واحدة يومياً - سواء كانت عادية أو دايت - يمكن أن يزيد من خطر الإصابة بمرض الكبد الدهني (MASLD) بنسبة 50-60%. يحث الخبراء على الاعتدال وينصحون باختيار الماء بدلاً من المشروبات الغازية لحماية صحة الكبد.
13-06-2025
الذكاء الاصطناعي من جوجل يتصدى للأعاصير: حقبة جديدة في التنبؤ بالطقس؟
نموذج جوجل الجديد للطقس المدعوم بالذكاء الاصطناعي للأعاصير، الذي طورته ديب مايند، يقدم قدرات تنبؤ محسنة وأوقات استباقية أطول، لكن الخبراء ينصحون بأنه يكمل التوقعات التقليدية.
ADVERTISEMENT
23-09-2025
بلو أوريجين تحصل على عقد من ناسا لتوصيل مركبة VIPER الجوالة إلى القطب الجنوبي للقمر
حصلت بلو أوريجين على عقد من وكالة ناسا لتوصيل المركبة الجوالة VIPER إلى القطب الجنوبي للقمر، مما يمثل خطوة مهمة لكل من الشركة واستكشاف القمر.
17-07-2025
يقال إن شركة ByteDance، الشركة الأم لـ TikTok، تعمل على تطوير نظارات الواقع المعزز خفيفة الوزن
ورد أن شركة ByteDance، الشركة الأم لـ TikTok، تقوم بتطوير نظارات الواقع المعزز خفيفة الوزن تحمل الاسم الرمزي "Phoenix"، بهدف توفير مدخل ميسور التكلفة إلى سوق الواقع الممتد (AR).
14-08-2025
صائدو أشباح أنتاركتيكا: داخل أكبر كاشف نيوترينو في العالم
استكشف آيس كيوب، أكبر كاشف نيوترينو في العالم في القارة القطبية الجنوبية، وأبحاثه الرائدة في الجسيمات دون الذرية المراوغة والظواهر الكونية.
ADVERTISEMENT