معيار OpenAI الجديد يكشف عن كفاءة الذكاء الاصطناعي المتزايدة في مهام العمل الواقعية

التكنولوجيا اليومية

التكنولوجيا اليومية

·

01/10/2025

button icon
ADVERTISEMENT

قدمت OpenAI معيارًا جديدًا، GDPval، مصممًا لتقييم أداء الذكاء الاصطناعي في المهام ذات القيمة الاقتصادية والواقعية في مختلف المهن. تهدف هذه المبادرة إلى ترسيخ المناقشات حول الذكاء الاصطناعي في مكان العمل بأدلة ملموسة، ومعالجة المخاوف من أن العديد من الشركات لا ترى عوائد كبيرة على استثماراتها في الذكاء الاصطناعي.

النقاط الرئيسية

معيار GDPval

تم تطوير معيار GDPval (قيمة الناتج المحلي الإجمالي) الخاص بـ OpenAI لسد الفجوة بين أداء الذكاء الاصطناعي في المشكلات النظرية وفائدته في سيناريوهات العمل العملية. يستمد التقييم المهام من المهن الرئيسية داخل الصناعات التي تساهم بشكل كبير في الناتج المحلي الإجمالي للولايات المتحدة، مثل العقارات والحكومة والتصنيع والمالية. تم تجنيد متخصصين بمتوسط ​​14 عامًا من الخبرة لتصميم مهام واقعية وتقديم أمثلة مكتوبة من قبل الإنسان لإكمال المهام بنجاح. تتراوح هذه المهام من صياغة المذكرات القانونية والمخططات الهندسية إلى إدارة تفاعلات دعم العملاء وإنشاء خطط الرعاية التمريضية.

ADVERTISEMENT

رؤى حول أداء الذكاء الاصطناعي

كشفت الاختبارات الأولية باستخدام GDPval على 220 مهمة أن نماذج الذكاء الاصطناعي الرائدة تقترب من جودة المستوى البشري في العديد من المجالات. حقق Claude Opus 4.1 أعلى معدل فوز وتعادل بنسبة 47.6٪ مقابل المهام المكتملة من قبل الإنسان، متفوقًا في مجالات مثل تنسيق المستندات وتخطيط الشرائح. تبع ذلك GPT-5 high بمعدل فوز وتعادل بنسبة 38.8٪، مما يدل على القوة في الدقة واتباع التعليمات. سجل GPT-4o نسبة 12.4٪. كان أداء نماذج الذكاء الاصطناعي جيدًا بشكل خاص في أدوار مثل العدادين وموظفي الإيجار، وموظفي الشحن والمخزون، ومديري المبيعات، ومطوري البرامج. وعلى العكس من ذلك، واجهوا المزيد من التحديات في المهام من المهندسين الصناعيين والصيادلة والمديرين الماليين ومحرري الفيديو.

ADVERTISEMENT

السرعة والتكلفة ومستقبل العمل

بالإضافة إلى الجودة، تدعي OpenAI أن نماذج الذكاء الاصطناعي هذه يمكنها إكمال مهام GDPval أسرع بحوالي 100 مرة وبتكلفة أقل 100 مرة من الخبراء البشريين. على الرغم من هذه القدرات الرائعة، تؤكد OpenAI أن الذكاء الاصطناعي من غير المرجح أن يحل محل العمال البشريين بالكامل. تقترح الشركة أن دور الذكاء الاصطناعي سيكون التعامل مع المهام الروتينية، مما يسمح للمهنيين البشريين بالتركيز بشكل أكبر على الجوانب الإبداعية والاستراتيجية والقائمة على الحكم في عملهم، وبالتالي تعزيز الإنتاجية الإجمالية والرضا الوظيفي.

قراءة مقترحة

15-08-2025
تين إيدج إنجينيرينغ توزع علبة كمبيوتر بلاستيكية مجانية
تُطلق تينج إنجينيرينج كمبيوتر-2، علبة حاسوب مجانية قابلة للطي مصنوعة من البلاستيك، مصممة لتجميعات mini-ITX.
ADVERTISEMENT
26-05-2025
ارتفاع مبيعات التكنولوجيا الاستهلاكية في الشرق الأوسط وأفريقيا إلى 68 مليار دولار هذا العام
مبيعات التكنولوجيا الاستهلاكية في الشرق الأوسط وأفريقيا تصل إلى 68 مليار دولار هذا العام، مع تزايد الطلب على الأجهزة الفاخرة والذكية.
18-08-2025
الروبوتات البشرية تستعد للإنجاب: تقنية الرحم الاصطناعي الصينية تثير جدلاً عالمياً
يزعم علماء صينيون أن الروبوتات الشبيهة بالبشر قد تتمكن قريبًا من إنجاب أطفال أحياء باستخدام أرحام اصطناعية، مما يثير نقاشات أخلاقية ويقدم حلولاً محتملة للعقم.
30-05-2025
Hugging Face تكشف عن روبوتين بشريين جديدين: HopeJR وReachy Mini
كشفت Hugging Face عن روبوتين بشريين جديدين، HopeJR وReachy Mini، مما يعزز التزامها بالروبوتات مفتوحة المصدر وبأسعار معقولة.
ADVERTISEMENT
18-07-2025
ثورة الذكاء الاصطناعي: من الروبوتات ميسورة التكلفة إلى النهضة الصناعية
استكشف أحدث التطورات في مجال الذكاء الاصطناعي: روبوتات شبيهة بالبشر بأسعار معقولة، والحرب الشرسة على المواهب في مجال الذكاء الاصطناعي، والتحولات الاقتصادية، والذكاء الفائق الطبي، والدعوات إلى مشاريع صناعية واسعة النطاق لدعم النمو السريع للذكاء الاصطناعي.
14-10-2025
محرر صور الذكاء الاصطناعي نانو موز من جوجل يتوسع ليشمل البحث و NotebookLM والصور
توسع أداة تحرير الصور بالذكاء الاصطناعي Nano Banana من جوجل نطاقها، مع خطط للتكامل مع بحث جوجل و NotebookLM وصور جوجل، مما يوفر للمستخدمين طرقًا جديدة لإنشاء وتحرير المرئيات.
15-10-2025
إنفيديا تكشف عن حاسوب مكتبي قوي للذكاء الاصطناعي: حاسوب DGX Spark المكتبي
تطلق Nvidia جهاز DGX Spark، وهو جهاز كمبيوتر مكتبي للذكاء الاصطناعي بسعر 4000 دولار، بقدرة حوسبة بيتا فلوب وذاكرة بسعة 128 جيجابايت، مما يتيح تشغيل نماذج الذكاء الاصطناعي الكبيرة محليًا.
ADVERTISEMENT
14-08-2025
الإمارات وفنلندا تُبرمان تحالفًا علميًا في الأرصاد الجوية والأبحاث القطبية
توقع الإمارات وفنلندا مذكرة تفاهم لتعزيز التعاون في مجال الأرصاد الجوية وأبحاث القطبين، مع التركيز على تبادل الخبرات وخدمات طقس الفضاء والذكاء الاصطناعي للتنبؤات.
20-08-2025
HMD Fuse: هاتف جديد صديق للأطفال يمنع التقاط المحتوى العاري بالذكاء الاصطناعي
تقدم HMD هاتف فيوز الذكي المزود بتقنية HarmBlock Plus المدعومة بالذكاء الاصطناعي لمنع الأطفال من التقاط وعرض المحتوى العاري، مما يعزز السلامة عبر الإنترنت.
07-10-2025
أغرا إم إي 2025 تطلق مساراً رؤيوياً نحو الأمن الغذائي في الشرق الأوسط
جمعت فعالية AgraME 2025 قادة عالميين في مجالات الزراعة والتكنولوجيا والاستدامة لتعزيز الأمن الغذائي في الشرق الأوسط، مع إبراز الابتكار والاستثمار والتعاون في مركز دبي التجاري العالمي.
ADVERTISEMENT