معيار OpenAI الجديد يكشف عن كفاءة الذكاء الاصطناعي المتزايدة في مهام العمل الواقعية

التكنولوجيا اليومية

التكنولوجيا اليومية

·

01/10/2025

button icon
ADVERTISEMENT

قدمت OpenAI معيارًا جديدًا، GDPval، مصممًا لتقييم أداء الذكاء الاصطناعي في المهام ذات القيمة الاقتصادية والواقعية في مختلف المهن. تهدف هذه المبادرة إلى ترسيخ المناقشات حول الذكاء الاصطناعي في مكان العمل بأدلة ملموسة، ومعالجة المخاوف من أن العديد من الشركات لا ترى عوائد كبيرة على استثماراتها في الذكاء الاصطناعي.

النقاط الرئيسية

معيار GDPval

تم تطوير معيار GDPval (قيمة الناتج المحلي الإجمالي) الخاص بـ OpenAI لسد الفجوة بين أداء الذكاء الاصطناعي في المشكلات النظرية وفائدته في سيناريوهات العمل العملية. يستمد التقييم المهام من المهن الرئيسية داخل الصناعات التي تساهم بشكل كبير في الناتج المحلي الإجمالي للولايات المتحدة، مثل العقارات والحكومة والتصنيع والمالية. تم تجنيد متخصصين بمتوسط ​​14 عامًا من الخبرة لتصميم مهام واقعية وتقديم أمثلة مكتوبة من قبل الإنسان لإكمال المهام بنجاح. تتراوح هذه المهام من صياغة المذكرات القانونية والمخططات الهندسية إلى إدارة تفاعلات دعم العملاء وإنشاء خطط الرعاية التمريضية.

ADVERTISEMENT

رؤى حول أداء الذكاء الاصطناعي

كشفت الاختبارات الأولية باستخدام GDPval على 220 مهمة أن نماذج الذكاء الاصطناعي الرائدة تقترب من جودة المستوى البشري في العديد من المجالات. حقق Claude Opus 4.1 أعلى معدل فوز وتعادل بنسبة 47.6٪ مقابل المهام المكتملة من قبل الإنسان، متفوقًا في مجالات مثل تنسيق المستندات وتخطيط الشرائح. تبع ذلك GPT-5 high بمعدل فوز وتعادل بنسبة 38.8٪، مما يدل على القوة في الدقة واتباع التعليمات. سجل GPT-4o نسبة 12.4٪. كان أداء نماذج الذكاء الاصطناعي جيدًا بشكل خاص في أدوار مثل العدادين وموظفي الإيجار، وموظفي الشحن والمخزون، ومديري المبيعات، ومطوري البرامج. وعلى العكس من ذلك، واجهوا المزيد من التحديات في المهام من المهندسين الصناعيين والصيادلة والمديرين الماليين ومحرري الفيديو.

ADVERTISEMENT

السرعة والتكلفة ومستقبل العمل

بالإضافة إلى الجودة، تدعي OpenAI أن نماذج الذكاء الاصطناعي هذه يمكنها إكمال مهام GDPval أسرع بحوالي 100 مرة وبتكلفة أقل 100 مرة من الخبراء البشريين. على الرغم من هذه القدرات الرائعة، تؤكد OpenAI أن الذكاء الاصطناعي من غير المرجح أن يحل محل العمال البشريين بالكامل. تقترح الشركة أن دور الذكاء الاصطناعي سيكون التعامل مع المهام الروتينية، مما يسمح للمهنيين البشريين بالتركيز بشكل أكبر على الجوانب الإبداعية والاستراتيجية والقائمة على الحكم في عملهم، وبالتالي تعزيز الإنتاجية الإجمالية والرضا الوظيفي.

قراءة مقترحة

01-10-2025
أمازون تكشف النقاب عن مكبرات صوت Echo جديدة: Echo Dot Max و Echo Studio يهدفان إلى تقديم تجربة صوتية محسنة
تطلق أمازون مكبرات الصوت الذكية الجديدة Echo Dot Max و Echo Studio، مع التركيز على جودة الصوت المحسنة والصوت المكاني وميزة Alexa Home Theater الجديدة. تكشف الانطباعات العملية عن تحسينات كبيرة في الجهير ومسرح الصوت، ولكن لا تزال هناك أسئلة حول التطبيق العملي للإعدادات المتقدمة والقدرات الكاملة لـ Alexa+.
ADVERTISEMENT
11-10-2025
المتسلل الكوني الخافت: علماء الفلك يرصدون جسماً نادراً قد يكشف أسرار المادة المظلمة
اكتشف علماء الفلك جسماً باهتاً منخفض الكتلة في الفضاء السحيق قد يكون دليلاً على المادة المظلمة، حيث استخدموا عدسة الجاذبية لرصد تأثيره على الضوء البعيد. قد يمثل هذا أصغر تجمع للمادة المظلمة يتم اكتشافه حتى الآن ويعزز فهمنا للكون.
13-08-2025
استغلت مجموعات الجريمة السيبرانية الروسية ثغرة وينرار ليوم الصفر لأسابيع
تستغل مجموعتان روسيتان للجريمة السيبرانية، وهما رومكوم وبيبر وير وولف، بنشاط ثغرة أمنية حرجة من نوع "يوم الصفر" في برنامج وينرار (CVE-2025-8088) منذ أسابيع، وذلك لزرع أبواب خلفية في الأنظمة المستهدفة.
27-06-2025
شاشة الموت الزرقاء سيئة السمعة في ويندوز على وشك أن تتحول إلى اللون الأسود
تغير مايكروسوفت شاشتها الأيقونية 'الشاشة الزرقاء للموت' إلى اللون الأسود، كجزء من جهد أوسع لتعزيز مرونة ويندوز وتبسيط تجربة المستخدم أثناء أخطاء النظام.
ADVERTISEMENT
28-07-2025
استراتيجية بلايستيشن الحصرية تتطور: هل هي متجهة نحو الكمبيوتر الشخصي، سويتش 2، والجوال؟
يُقال إن سوني توسع استراتيجيتها لجلب ألعاب بلاي ستيشن الحصرية إلى أجهزة الكمبيوتر الشخصية، ونينتندو سويتش 2، والأجهزة المحمولة، مما يشير إلى تحول كبير في نهجها للتوزيع.
14-10-2025
سماعات سوني WH-CH520 بسعر مغرٍ يبلغ 38 دولارًا، أقل بكثير من AirPods Max
سماعات سوني WH-CH520 اللاسلكية معروضة للبيع بسعر 38 دولارًا على أمازون، وتقدم تجربة صوتية مريحة وقابلة للتخصيص بجزء بسيط من تكلفة البدائل الممتازة مثل AirPods Max.
28-09-2025
الروبوتات الشبيهة بالبشر تدشن عصرًا جديدًا في بناء السفن، معززة الكفاءة والسلامة
يتم دمج الروبوتات الشبيهة بالبشر في أحواض بناء السفن لتعزيز السلامة والكفاءة، مما يمثل تقدمًا تكنولوجيًا كبيرًا في الصناعة البحرية. تعرف على المزيد حول هذا التعاون وتداعياته.
ADVERTISEMENT
05-08-2025
روبوت بشري يتعلم غسل الملابس، مبشرًا بمستقبل من الأعمال المنزلية المؤتمتة
اكتشف كيف يتعلم روبوت Figure البشري الجديد، المدعوم بنموذج Helix AI، غسل الملابس، مما قد يحدث ثورة في الأعمال المنزلية ويجلب الأتمتة المتقدمة إلى المنازل.
28-07-2025
التواصل الاجتماعي: القوة الخارقة غير المتوقعة لجهاز مناعة أقوى وحياة أطول
اكتشف كيف أن التفاعل الاجتماعي، وليس المكملات الغذائية باهظة الثمن، هو المفتاح المدهش لنظام مناعي أقوى وحياة أطول، وفقًا لأخصائية المناعة الدكتورة جينا ماتشيوكي.
27-11-2025
ارتفاع أسعار ذاكرة الوصول العشوائي من المتوقع أن يزيد التكاليف لأجهزة الكمبيوتر المخصصة للألعاب المجمعة مسبقًا
من المقرر أن ترتفع أسعار أجهزة الكمبيوتر المخصصة للألعاب مسبقة الصنع بسبب الارتفاع الكبير في تكاليف ذاكرة الوصول العشوائي (RAM)، مما يؤثر على الشركات المصنعة مثل CyberPowerPC و Maingear. تعرف على المزيد حول الأسباب والنصائح المحتملة للمستهلكين.
ADVERTISEMENT