معيار OpenAI الجديد يكشف عن كفاءة الذكاء الاصطناعي المتزايدة في مهام العمل الواقعية

التكنولوجيا اليومية

التكنولوجيا اليومية

·

01/10/2025

button icon
ADVERTISEMENT

قدمت OpenAI معيارًا جديدًا، GDPval، مصممًا لتقييم أداء الذكاء الاصطناعي في المهام ذات القيمة الاقتصادية والواقعية في مختلف المهن. تهدف هذه المبادرة إلى ترسيخ المناقشات حول الذكاء الاصطناعي في مكان العمل بأدلة ملموسة، ومعالجة المخاوف من أن العديد من الشركات لا ترى عوائد كبيرة على استثماراتها في الذكاء الاصطناعي.

النقاط الرئيسية

معيار GDPval

تم تطوير معيار GDPval (قيمة الناتج المحلي الإجمالي) الخاص بـ OpenAI لسد الفجوة بين أداء الذكاء الاصطناعي في المشكلات النظرية وفائدته في سيناريوهات العمل العملية. يستمد التقييم المهام من المهن الرئيسية داخل الصناعات التي تساهم بشكل كبير في الناتج المحلي الإجمالي للولايات المتحدة، مثل العقارات والحكومة والتصنيع والمالية. تم تجنيد متخصصين بمتوسط ​​14 عامًا من الخبرة لتصميم مهام واقعية وتقديم أمثلة مكتوبة من قبل الإنسان لإكمال المهام بنجاح. تتراوح هذه المهام من صياغة المذكرات القانونية والمخططات الهندسية إلى إدارة تفاعلات دعم العملاء وإنشاء خطط الرعاية التمريضية.

ADVERTISEMENT

رؤى حول أداء الذكاء الاصطناعي

كشفت الاختبارات الأولية باستخدام GDPval على 220 مهمة أن نماذج الذكاء الاصطناعي الرائدة تقترب من جودة المستوى البشري في العديد من المجالات. حقق Claude Opus 4.1 أعلى معدل فوز وتعادل بنسبة 47.6٪ مقابل المهام المكتملة من قبل الإنسان، متفوقًا في مجالات مثل تنسيق المستندات وتخطيط الشرائح. تبع ذلك GPT-5 high بمعدل فوز وتعادل بنسبة 38.8٪، مما يدل على القوة في الدقة واتباع التعليمات. سجل GPT-4o نسبة 12.4٪. كان أداء نماذج الذكاء الاصطناعي جيدًا بشكل خاص في أدوار مثل العدادين وموظفي الإيجار، وموظفي الشحن والمخزون، ومديري المبيعات، ومطوري البرامج. وعلى العكس من ذلك، واجهوا المزيد من التحديات في المهام من المهندسين الصناعيين والصيادلة والمديرين الماليين ومحرري الفيديو.

ADVERTISEMENT

السرعة والتكلفة ومستقبل العمل

بالإضافة إلى الجودة، تدعي OpenAI أن نماذج الذكاء الاصطناعي هذه يمكنها إكمال مهام GDPval أسرع بحوالي 100 مرة وبتكلفة أقل 100 مرة من الخبراء البشريين. على الرغم من هذه القدرات الرائعة، تؤكد OpenAI أن الذكاء الاصطناعي من غير المرجح أن يحل محل العمال البشريين بالكامل. تقترح الشركة أن دور الذكاء الاصطناعي سيكون التعامل مع المهام الروتينية، مما يسمح للمهنيين البشريين بالتركيز بشكل أكبر على الجوانب الإبداعية والاستراتيجية والقائمة على الحكم في عملهم، وبالتالي تعزيز الإنتاجية الإجمالية والرضا الوظيفي.

قراءة مقترحة

24-09-2025
دي جي آي تكشف عن كاميرا حركة مغناطيسية صغيرة، أوزمو نانو، مستوحاة من إنستا360
تقدم DJI كاميرا Osmo Nano، كاميرا حركة مغناطيسية صغيرة بميزات متقدمة، مستوحاة من Insta360، لكن توفرها محدود خارج الولايات المتحدة.
ADVERTISEMENT
18-08-2025
نظارات ميتا للواقع المعزز 'هايبرنوفا' تستعد لظهور أرخص
من المتوقع أن تُطلق نظارات الواقع المعزز "هايبرنوفا" القادمة من ميتا بسعر أقل يبلغ حوالي 800 دولار، مما قد يجعل تقنية الواقع المعزز في متناول المستهلكين بشكل أكبر.
01-09-2025
تنبيه لمستخدمي Gmail: جوجل تصدر تحذيرًا أمنيًا عاجلاً وسط تصاعد هجمات التصيد الاحتيالي
تصدر جوجل تحذيرًا أمنيًا عاجلاً لـ 2.5 مليار مستخدم لـ Gmail بعد اختراق البيانات، وتفصل التغييرات الهامة في القواعد واستراتيجيات التخفيف من هجمات التصيد الاحتيالي.
09-07-2025
سوني برافيا تلفزيونات LED: مستقبل الترفيه المنزلي في عام 2025
استكشف أفضل تلفزيونات سوني برافيا LED لعام 2025، التي تقدم جودة صورة فائقة وميزات ذكية وأحجام شاشات متنوعة لتجربة ترفيه منزلي مثالية.
ADVERTISEMENT
10-09-2025
إيربودز برو 3 تصل: نظرة عميقة على التحسينات مقارنةً بإيربودز برو 2
قارن ابل ايربودز برو 3 الجديد مع ايربودز برو 2. اكتشف التحسينات في إلغاء الضوضاء النشط، الصوت، عمر البطارية، الميزات الصحية الجديدة، والراحة.
10-07-2025
انقطاع في Outlook: آلاف المستخدمين يتأثرون بتعطيل البريد الإلكتروني
واجه آلاف المستخدمين لبرنامج Microsoft Outlook انقطاعات في خدمة البريد الإلكتروني، بما في ذلك مشاكل في التحميل وتسجيل الدخول، ليلة الأربعاء وصباح الخميس. تقوم Microsoft بنشر إصلاح مصحح بعد فشل العلاج الأولي.
07-08-2025
إليفين لابس تدخل ساحة الموسيقى بالذكاء الاصطناعي بخدمة توليد خالية من حقوق الملكية
تطلق شركة ElevenLabs الناشئة في مجال الذكاء الاصطناعي خدمة Eleven Music، وهي خدمة جديدة لتوليد الموسيقى بالذكاء الاصطناعي خالية من حقوق الملكية. تعرف على ميزاتها ومصادر بياناتها وتأثيرها على مشهد الموسيقى بالذكاء الاصطناعي.
ADVERTISEMENT
24-06-2025
لقد حصل هاتف Android الخاص بك للتو على ترقية Gemini رئيسية لمحبي الموسيقى
اكتشف كيف حصل مساعد جوجل Gemini AI على هواتف أندرويد على ترقية رئيسية ومجانية لمحبي الموسيقى، مما يتيح التعرف السهل على الأغاني عن طريق الاستماع أو الدندنة.
17-07-2025
جالاكسي ووتش 8 تضيف حماية للبطارية لتعزيز طول العمر
تتضمن ساعة Galaxy Watch 8 من سامسونج الآن ميزة حماية البطارية التي تحد من الشحن بين 85٪ و 90٪، مما يقلل الضغط على الخلية ويطيل عمرها الافتراضي.
21-07-2025
تم استغلال ثغرات يوم الصفر الجديدة في SharePoint في هجمات تنفيذ التعليمات البرمجية عن بعد، وتحديثات الأمان قيد الانتظار.
يتم استغلال ثغرات اليوم الصفري في Microsoft SharePoint CVE-2025-53770 و CVE-2025-53771 بنشاط، مما يسمح بتنفيذ التعليمات البرمجية عن بُعد على الخوادم المحلية غير المحدثة. تعرف على التأثير والتخفيفات وطرق الكشف.
ADVERTISEMENT
14-08-2025
سوق بطاريات الحالة الصلبة للروبوتات البشرية مهيأ لنمو قوي حتى عام 2031
استكشف توقعات سوق البطاريات الصلبة للروبوتات البشرية لعام 2025، مع تفصيل فرص النمو، واتجاهات السوق، واللاعبين الرئيسيين، والتصنيف عبر الصناعات.
17-07-2025
أعلن ماسك عن رفيق Grok AI الجديد الذي يعكس الملياردير
إيلون ماسك يثير التشويق لرفيق ذكر جديد يعمل بالذكاء الاصطناعي على منصة Grok الخاصة به، مستوحى من إدوارد كولين وكريستيان جراي، مما يثير تساؤلات حول الملكية الفكرية والصورة الذاتية والرومانسية الرقمية.
24-07-2025
فيديو ترويجي لهاتف Pixel 10 تم دحضه: مفهوم من صنع المعجبين، وليس تسريبًا رسميًا
تم دحض فيديو ترويجي مزعوم لجهاز Pixel 10 يضم شريحة Tensor G5 باعتباره مفهومًا من صنع المعجبين، مع إزالة الإسناد الأصلي في إعادة التحميل.
ADVERTISEMENT
12-06-2025
فيلم 'ديب كوفر' من برايم فيديو يقلب سيناريو الدراما الجريمة البريطانية بطريقة مضحكة
اكتشف 'Deep Cover'، الكوميديا ​​الحركية الجديدة من Prime Video التي تقلب السيناريو بشكل مضحك في دراما الجريمة البريطانية، بطولة برايس دالاس هوارد، أورلاندو بلوم، ونيك محمد.
22-09-2025
الكويكب 2024 YR4: العلماء يقترحون تدميره لحماية القمر والأرض
كويكب، 2024 YR4، لديه فرصة بنسبة 4% للاصطدام بالقمر في عام 2032، مما دفع العلماء إلى التفكير في تدميره. تعرف على المخاطر والحلول المقترحة.
03-07-2025
نظرة خاطفة على Prime Day: حامل Spider-Man Echo Dot يظهر لأول مرة بخصم مبكر
يبدأ يوم Prime Day لعام 2025 من أمازون مبكرًا مع حامل Echo Dot Spider-Man المخفض وعروض الأجهزة المنزلية الذكية الأخرى، مما يتيح لك تحويل Echo Dot الخاص بك إلى مساعد خارق.
ADVERTISEMENT