منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

08-07-2025
حصل روبوت على شهادة في حفل تخرج المدرسة الثانوية في الصين
حصل روبوت شبيه بالبشر على شهادة في حفل تخرج من المدرسة الثانوية في فوجيان، الصين، مما يمثل لحظة فكاهية وهامة لدمج الذكاء الاصطناعي.
ADVERTISEMENT
03-06-2025
لماذا فشلت "MultiVersus"؟ حدود تجميع الملكيات الفكرية في الألعاب
تحليل شامل لأسباب إغلاق لعبة "MultiVersus" وتأثير استراتيجيات تجميع الملكيات الفكرية على صناعة الألعاب.
29-05-2025
الصين توسع آفاقها في النظام الشمسي بإطلاق مهمة استكشاف الكويكبات
توسعت الصين في استكشاف الفضاء بإطلاق مهمة Tianwen-2 لاستكشاف الكويكبات، مع خطط مستقبلية تشمل المريخ وزحل.
27-05-2025
الجدل حول استخدام الذكاء الاصطناعي في أطروحات الطلاب في الجامعات الصينية
تتزايد النقاشات حول استخدام الذكاء الاصطناعي في أطروحات الطلاب في الجامعات الصينية، حيث تفرض الجامعات قيودًا جديدة للحفاظ على نزاهة الأكاديمية.
ADVERTISEMENT
23-05-2025
الرؤساء التنفيذيون في مجال التكنولوجيا يستخدمون الذكاء الاصطناعي لاستبدال أنفسهم
تقرير عن استخدام الرؤساء التنفيذيين في مجال التكنولوجيا للذكاء الاصطناعي لاستبدال أنفسهم في مكالمات الأرباح، وتأثير ذلك على القوى العاملة.
22-05-2025
آبل تكشف عن طريقة تدريب مبتكرة للروبوتات البشرية
آبل تكشف عن طريقة جديدة لتدريب الروبوتات البشرية باستخدام معلمين بشريين جنبًا إلى جنب مع الروبوتات، مما يحسن فعالية التدريب ويقلل التكاليف.
03-06-2025
لا تزل هذا الغشاء البلاستيكي عند فتح جهاز نينتندو سويتش 2 الجديد!
اكتشف لماذا يجب ألا تزيل الغشاء البلاستيكي الواقي عن شاشة نينتندو سويتش 2 الجديد، ونصائح هامة للعناية بالجهاز.
ADVERTISEMENT
29-05-2025
جوجل صور تحتفل بمرور 10 سنوات على إطلاقها مع أكثر من 9 تريليون صورة وفيديو
احتفلت جوجل صور بمرور 10 سنوات على إطلاقها، مع أكثر من 9 تريليون صورة وفيديو مخزنة، وقدمت ميزات جديدة مثل محرر الصور المعاد تصميمه وأكواد QR لمشاركة الألبومات.
20-06-2025
انفجار سفينة الفضاء ستار شيب التابعة لسبيس إكس في تكساس خلال اختبار فاشل
انفجر النموذج الأولي لمركبة سبيس إكس ستارشيب، السفينة 36، في منشأة اختبار في تكساس في 18 يونيو، مما أثر على الاستعدادات للرحلة 10. وعزا الرئيس التنفيذي إيلون ماسك السبب إلى فشل في خزان الضغط المركب (COPV). وتضيف هذه الحادثة إلى النكسات الأخيرة للصاروخ المتجه إلى القمر والمريخ.
18-06-2025
إيليو من بيكسار: رحلة خيال علمي للقلب والشفاء
اكتشف فيلم بيكسار الجديد 'إيليو'، مغامرة خيال علمي مؤثرة تستكشف مواضيع الحزن والانتماء والصداقة عبر الكون. تعرف على قصته الفريدة ومرئياته المذهلة.
ADVERTISEMENT
23-05-2025
Xiaomi PU7: تهديد جديد لتيسلا في سوق السيارات الكهربائية بالصين
تستعد شاومي لإطلاق سيارتها الكهربائية PU7، التي تهدد مكانة تيسلا في السوق الصينية، مع ميزات متقدمة وأداء قوي.
07-07-2025
نصيحة مسؤول تنفيذي في Microsoft بشأن الذكاء الاصطناعي للعاملين المسرحين تثير غضبًا
يواجه مسؤول تنفيذي في Microsoft Xbox ردود فعل عنيفة لنصحه الموظفين المسرحين باستخدام روبوتات الدردشة المدعومة بالذكاء الاصطناعي للتغلب على الحزن الناتج عن فقدان الوظيفة، مما أثار انتقادات واسعة النطاق.
20-05-2025
هل يمكن أن تكون "الذكاء الاصطناعي النظيف" حلاً لمخاوف هوليوود التقنية؟
تستكشف هوليوود إمكانية استخدام "الذكاء الاصطناعي النظيف" كحل لمخاوفها التقنية، مع التركيز على نموذج "ماراي" الذي تم تدريبه بشكل أخلاقي.
ADVERTISEMENT
28-05-2025
آبل تستحوذ على أول استوديو ألعاب لها وتخطط للكشف عن تطبيق ألعاب جديد في WWDC 2025
آبل تستحوذ على أول استوديو ألعاب لها، RAC7، وتخطط للكشف عن تطبيق ألعاب جديد في WWDC 2025 لتعزيز وجودها في سوق الألعاب.
03-07-2025
نظرة خاطفة على Prime Day: حامل Spider-Man Echo Dot يظهر لأول مرة بخصم مبكر
يبدأ يوم Prime Day لعام 2025 من أمازون مبكرًا مع حامل Echo Dot Spider-Man المخفض وعروض الأجهزة المنزلية الذكية الأخرى، مما يتيح لك تحويل Echo Dot الخاص بك إلى مساعد خارق.
13-06-2025
الذكاء الاصطناعي من جوجل يتصدى للأعاصير: حقبة جديدة في التنبؤ بالطقس؟
نموذج جوجل الجديد للطقس المدعوم بالذكاء الاصطناعي للأعاصير، الذي طورته ديب مايند، يقدم قدرات تنبؤ محسنة وأوقات استباقية أطول، لكن الخبراء ينصحون بأنه يكمل التوقعات التقليدية.
ADVERTISEMENT