معيار OpenAI الجديد يكشف عن كفاءة الذكاء الاصطناعي المتزايدة في مهام العمل الواقعية

التكنولوجيا اليومية

التكنولوجيا اليومية

·

01/10/2025

button icon
ADVERTISEMENT

قدمت OpenAI معيارًا جديدًا، GDPval، مصممًا لتقييم أداء الذكاء الاصطناعي في المهام ذات القيمة الاقتصادية والواقعية في مختلف المهن. تهدف هذه المبادرة إلى ترسيخ المناقشات حول الذكاء الاصطناعي في مكان العمل بأدلة ملموسة، ومعالجة المخاوف من أن العديد من الشركات لا ترى عوائد كبيرة على استثماراتها في الذكاء الاصطناعي.

النقاط الرئيسية

معيار GDPval

تم تطوير معيار GDPval (قيمة الناتج المحلي الإجمالي) الخاص بـ OpenAI لسد الفجوة بين أداء الذكاء الاصطناعي في المشكلات النظرية وفائدته في سيناريوهات العمل العملية. يستمد التقييم المهام من المهن الرئيسية داخل الصناعات التي تساهم بشكل كبير في الناتج المحلي الإجمالي للولايات المتحدة، مثل العقارات والحكومة والتصنيع والمالية. تم تجنيد متخصصين بمتوسط ​​14 عامًا من الخبرة لتصميم مهام واقعية وتقديم أمثلة مكتوبة من قبل الإنسان لإكمال المهام بنجاح. تتراوح هذه المهام من صياغة المذكرات القانونية والمخططات الهندسية إلى إدارة تفاعلات دعم العملاء وإنشاء خطط الرعاية التمريضية.

ADVERTISEMENT

رؤى حول أداء الذكاء الاصطناعي

كشفت الاختبارات الأولية باستخدام GDPval على 220 مهمة أن نماذج الذكاء الاصطناعي الرائدة تقترب من جودة المستوى البشري في العديد من المجالات. حقق Claude Opus 4.1 أعلى معدل فوز وتعادل بنسبة 47.6٪ مقابل المهام المكتملة من قبل الإنسان، متفوقًا في مجالات مثل تنسيق المستندات وتخطيط الشرائح. تبع ذلك GPT-5 high بمعدل فوز وتعادل بنسبة 38.8٪، مما يدل على القوة في الدقة واتباع التعليمات. سجل GPT-4o نسبة 12.4٪. كان أداء نماذج الذكاء الاصطناعي جيدًا بشكل خاص في أدوار مثل العدادين وموظفي الإيجار، وموظفي الشحن والمخزون، ومديري المبيعات، ومطوري البرامج. وعلى العكس من ذلك، واجهوا المزيد من التحديات في المهام من المهندسين الصناعيين والصيادلة والمديرين الماليين ومحرري الفيديو.

ADVERTISEMENT

السرعة والتكلفة ومستقبل العمل

بالإضافة إلى الجودة، تدعي OpenAI أن نماذج الذكاء الاصطناعي هذه يمكنها إكمال مهام GDPval أسرع بحوالي 100 مرة وبتكلفة أقل 100 مرة من الخبراء البشريين. على الرغم من هذه القدرات الرائعة، تؤكد OpenAI أن الذكاء الاصطناعي من غير المرجح أن يحل محل العمال البشريين بالكامل. تقترح الشركة أن دور الذكاء الاصطناعي سيكون التعامل مع المهام الروتينية، مما يسمح للمهنيين البشريين بالتركيز بشكل أكبر على الجوانب الإبداعية والاستراتيجية والقائمة على الحكم في عملهم، وبالتالي تعزيز الإنتاجية الإجمالية والرضا الوظيفي.

قراءة مقترحة

08-07-2025
الإنسان الآلي زايون يذهل ديترويت وينتشر بسرعة
روبوت شبيه بالبشر يدعى Zion يمشي في شوارع ديترويت، ويفاجئ المارة ويثير مناقشات واسعة الانتشار، كجزء من مبادرة لتعزيز الروبوتات وإلهام الشباب.
ADVERTISEMENT
29-05-2025
جيم كرامر: الذكاء الاصطناعي قد يكون "القوة الأكثر أهمية" في مستقبل الوظائف
جيم كرامر يتحدث عن تأثير الذكاء الاصطناعي على سوق العمل، محذرًا من زيادة البطالة وفقدان الوظائف، بينما يشير إلى الفوائد المحتملة لهذه التكنولوجيا.
14-10-2025
سماعات سوني WH-CH520 بسعر مغرٍ يبلغ 38 دولارًا، أقل بكثير من AirPods Max
سماعات سوني WH-CH520 اللاسلكية معروضة للبيع بسعر 38 دولارًا على أمازون، وتقدم تجربة صوتية مريحة وقابلة للتخصيص بجزء بسيط من تكلفة البدائل الممتازة مثل AirPods Max.
12-11-2025
أهم اتجاهات التكنولوجيا المتنقلة التي يجب مراقبتها بحلول عام 2025
أهم اتجاهات التكنولوجيا المتنقلة التي يجب مراقبتها بحلول عام 2025
ADVERTISEMENT
24-11-2025
أهم 7 اتجاهات للذكاء الاصطناعي تشكل نماذج اللغة الكبيرة بحلول عام 2025
استكشف أهم 7 اتجاهات للذكاء الاصطناعي لنماذج اللغة بحلول عام 2025، مع تسليط الضوء على القادة الناشئين مثل Gemini و DeepSeek، وتغيير توقعات المستخدمين.
21-01-2026
تعطيل ميزات الترجمة المتقدمة على يوتيوب بشكل غامض، والمبدعون مستاؤون
عطّلت جوجل مؤقتًا تنسيق الترجمة المتقدمة SRV3 على يوتيوب بسبب خطأ، مما أثار قلق المبدعين الذين يعتمدون على ميزاته المخصصة. وتؤكد الشركة أن هذا إصلاح مؤقت.
29-08-2025
جوجل تكشف عن Pixel Care Plus: حماية معززة لأجهزة بيكسل الخاصة بك
جوجل تقدم بيكسل كير بلس، برنامج حماية أجهزة جديد يحل محل جوجل بريفيرد كير. تعرف على التغطية والأسعار وما يحتاج المشتركون الحاليون لمعرفته.
ADVERTISEMENT
23-12-2025
الاتجاهات الرئيسية في التكنولوجيا والسرد الناشئة من 'أفاتار: النار والرماد'
استكشف ستة اتجاهات تكنولوجية وسردية رئيسية أبرزتها "أفاتار: النار والرماد"، بما في ذلك التكيف البيولوجي، والخلود الرقمي، وتعاقب القيادة.
11-09-2025
ذكاء جوجل الاصطناعي يعلن بالخطأ أن وكالة DOGE التابعة لإيلون ماسك وهمية
وصفت الذكاء الاصطناعي من جوجل وكالة DOGE التابعة لإيلون ماسك بأنها وهمية عن طريق الخطأ، مما أثار الارتباك ودفع عملاق التكنولوجيا إلى الاعتراف بالخطأ.
12-06-2025
فيلم 'ديب كوفر' من برايم فيديو يقلب سيناريو الدراما الجريمة البريطانية بطريقة مضحكة
اكتشف 'Deep Cover'، الكوميديا ​​الحركية الجديدة من Prime Video التي تقلب السيناريو بشكل مضحك في دراما الجريمة البريطانية، بطولة برايس دالاس هوارد، أورلاندو بلوم، ونيك محمد.
ADVERTISEMENT