معيار OpenAI الجديد يكشف عن كفاءة الذكاء الاصطناعي المتزايدة في مهام العمل الواقعية

التكنولوجيا اليومية

التكنولوجيا اليومية

·

01/10/2025

button icon
ADVERTISEMENT

قدمت OpenAI معيارًا جديدًا، GDPval، مصممًا لتقييم أداء الذكاء الاصطناعي في المهام ذات القيمة الاقتصادية والواقعية في مختلف المهن. تهدف هذه المبادرة إلى ترسيخ المناقشات حول الذكاء الاصطناعي في مكان العمل بأدلة ملموسة، ومعالجة المخاوف من أن العديد من الشركات لا ترى عوائد كبيرة على استثماراتها في الذكاء الاصطناعي.

النقاط الرئيسية

معيار GDPval

تم تطوير معيار GDPval (قيمة الناتج المحلي الإجمالي) الخاص بـ OpenAI لسد الفجوة بين أداء الذكاء الاصطناعي في المشكلات النظرية وفائدته في سيناريوهات العمل العملية. يستمد التقييم المهام من المهن الرئيسية داخل الصناعات التي تساهم بشكل كبير في الناتج المحلي الإجمالي للولايات المتحدة، مثل العقارات والحكومة والتصنيع والمالية. تم تجنيد متخصصين بمتوسط ​​14 عامًا من الخبرة لتصميم مهام واقعية وتقديم أمثلة مكتوبة من قبل الإنسان لإكمال المهام بنجاح. تتراوح هذه المهام من صياغة المذكرات القانونية والمخططات الهندسية إلى إدارة تفاعلات دعم العملاء وإنشاء خطط الرعاية التمريضية.

ADVERTISEMENT

رؤى حول أداء الذكاء الاصطناعي

كشفت الاختبارات الأولية باستخدام GDPval على 220 مهمة أن نماذج الذكاء الاصطناعي الرائدة تقترب من جودة المستوى البشري في العديد من المجالات. حقق Claude Opus 4.1 أعلى معدل فوز وتعادل بنسبة 47.6٪ مقابل المهام المكتملة من قبل الإنسان، متفوقًا في مجالات مثل تنسيق المستندات وتخطيط الشرائح. تبع ذلك GPT-5 high بمعدل فوز وتعادل بنسبة 38.8٪، مما يدل على القوة في الدقة واتباع التعليمات. سجل GPT-4o نسبة 12.4٪. كان أداء نماذج الذكاء الاصطناعي جيدًا بشكل خاص في أدوار مثل العدادين وموظفي الإيجار، وموظفي الشحن والمخزون، ومديري المبيعات، ومطوري البرامج. وعلى العكس من ذلك، واجهوا المزيد من التحديات في المهام من المهندسين الصناعيين والصيادلة والمديرين الماليين ومحرري الفيديو.

ADVERTISEMENT

السرعة والتكلفة ومستقبل العمل

بالإضافة إلى الجودة، تدعي OpenAI أن نماذج الذكاء الاصطناعي هذه يمكنها إكمال مهام GDPval أسرع بحوالي 100 مرة وبتكلفة أقل 100 مرة من الخبراء البشريين. على الرغم من هذه القدرات الرائعة، تؤكد OpenAI أن الذكاء الاصطناعي من غير المرجح أن يحل محل العمال البشريين بالكامل. تقترح الشركة أن دور الذكاء الاصطناعي سيكون التعامل مع المهام الروتينية، مما يسمح للمهنيين البشريين بالتركيز بشكل أكبر على الجوانب الإبداعية والاستراتيجية والقائمة على الحكم في عملهم، وبالتالي تعزيز الإنتاجية الإجمالية والرضا الوظيفي.

قراءة مقترحة

16-06-2025
لوحة المفاتيح بقيمة 3600 دولار: داخل سعي ريان نورباور للحصول على جهاز 'نهاية اللعبة'
استكشف إنشاء لوحة مفاتيح Seneca التي تبلغ تكلفتها 3600 دولار من قبل ريان نورباور، مع تفصيل تصميمها المخصص وابتكاراتها الهندسية والفلسفة وراء بناء تجربة الكتابة "النهائية".
ADVERTISEMENT
04-01-2026
الاتجاهات الرئيسية في الروبوتات الزراعية: صعود الأتمتة الزراعية
استكشف أهم 5 اتجاهات في مجال الروبوتات الزراعية، مع أمثلة واقعية لكيفية تحويل الروبوتات التجارية والذكاء الاصطناعي للزراعة الحديثة.
11-06-2025
مقابلة WWDC: المديرون التنفيذيون في Apple يكشفون عن تأخير Siri ومستقبل Apple Intelligence
يناقش المديران التنفيذيان في شركة Apple، كريج فيديريغي وجريج جوسوياك، تأخر Siri، ونهج Apple الفريد في الذكاء الاصطناعي، ومستقبل Apple Intelligence، مع التركيز على الميزات المتكاملة بدلاً من روبوتات الدردشة المستقلة.
27-05-2025
ضرورة ملكية النماذج اللغوية الكبيرة للذكاء الاصطناعي بشكل عام
تتناول المقالة أهمية ملكية النماذج اللغوية الكبيرة للذكاء الاصطناعي بشكل عام، وتسلط الضوء على المخاوف المتعلقة بالشفافية وعدم المساواة في الوصول.
ADVERTISEMENT
19-12-2025
جوجل تكشف عن ميزات Pixel الجديدة في آخر تحديث تجريبي لنظام أندرويد
تطلق جوجل الإصدار التجريبي الأول من Android QPR3 لأجهزة Pixel، والذي يقدم ميزات مثل سطوع قابل للتعديل للمصباح اليدوي والقدرة على إزالة عنصر واجهة المستخدم "نظرة سريعة". تعرف على المزيد حول الميزات الجديدة وكيفية تثبيت الإصدار التجريبي.
09-08-2025
مراجعة شاملة لخطط ناسا لاستبدال محطة الفضاء الدولية وسط تخفيضات الميزانية
تخضع خطط ناسا لاستبدال محطة الفضاء الدولية لتعديلات جذرية بسبب تخفيضات الميزانية، مع تقليل المتطلبات لمحطات الفضاء التجارية الجديدة.
26-12-2025
الاتجاهات الرئيسية التي تشكل مستقبل الروبوتات المنزلية في عام 2026
استكشف أهم اتجاهات الروبوتات المنزلية لعام 2026، من المساعد البشري LG CLOiD إلى التخصيص المدفوع بالذكاء الاصطناعي والتكامل مع المنزل الذكي، بناءً على ابتكارات حقيقية.
ADVERTISEMENT
21-08-2025
ASUS تكشف عن وحدة معالجة الرسوميات RTX 5090 إصدار الذكرى السنوية الفريدة من نوعها
تكشف ASUS عن ROG Matrix GeForce RTX 5090 – إصدار الذكرى الثلاثين، وهي وحدة معالجة رسومية فريدة بأربعة مراوح مستوحاة من أكيرا وبطاقة ROG Matrix 9800 GT لعام 2008. هذه البطاقة الحصرية متاحة فقط من خلال الفوز بمسابقة.
09-02-2026
تسريبات حول أجهزة بلايستيشن المستقبلية: شائعات حول PS6 وجهاز محمول جديد بترقيات ذاكرة كبيرة
تشير الشائعات إلى أن جهاز بلاي ستيشن 6 سيحتوي على 30 جيجابايت من ذاكرة GDDR7، ومن المتوقع وجود جهاز بلاي ستيشن محمول جديد بذاكرة LPDDR5X بسعة 24 جيجابايت، مما يشير إلى ترقيات كبيرة في الأداء.
24-09-2025
أنهار القطب الشمالي تتحول بشكل غامض إلى اللون البرتقالي مع كشف الجليد عن قوته الكيميائية
كشفت أبحاث جديدة أن الجليد، وليس الماء السائل فقط، يلعب دورًا حاسمًا في إذابة معادن الحديد، مما قد يفسر اللون البرتقالي الغريب للأنهار القطبية الشمالية مع اشتداد تغير المناخ لدورات التجمد والذوبان.
ADVERTISEMENT