منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

28-07-2025
استراتيجية بلايستيشن الحصرية تتطور: هل هي متجهة نحو الكمبيوتر الشخصي، سويتش 2، والجوال؟
يُقال إن سوني توسع استراتيجيتها لجلب ألعاب بلاي ستيشن الحصرية إلى أجهزة الكمبيوتر الشخصية، ونينتندو سويتش 2، والأجهزة المحمولة، مما يشير إلى تحول كبير في نهجها للتوزيع.
ADVERTISEMENT
18-07-2025
ساعة Pixel Watch 4: قفزة نحو قابلية الإصلاح والاستدامة
يشاع أن ساعة Pixel Watch 4 القادمة ستكون قابلة للإصلاح، وهو تغيير كبير عن النماذج السابقة التي كانت عرضة لأن تصبح نفايات إلكترونية في حالة تلفها. يتماشى هذا التحول مع أهداف Google للاستدامة.
23-05-2025
الرؤساء التنفيذيون في مجال التكنولوجيا يستخدمون الذكاء الاصطناعي لاستبدال أنفسهم
تقرير عن استخدام الرؤساء التنفيذيين في مجال التكنولوجيا للذكاء الاصطناعي لاستبدال أنفسهم في مكالمات الأرباح، وتأثير ذلك على القوى العاملة.
19-06-2025
شركة xAI لإيلون ماسك تستهلك مليار دولار شهريًا حسب التقارير
يقال إن شركة xAI التابعة لإيلون ماسك تحرق مليار دولار شهريًا، مما يثير تساؤلات حول استدامتها المالية على الرغم من حملات جمع التبرعات العدوانية وخطط تطوير الذكاء الاصطناعي الطموحة.
ADVERTISEMENT
10-09-2025
صعود الذكاء الاصطناعي المتسارع يتطلب الحذر والتأهب، يحث الخبراء
استكشف الصعود السريع للذكاء الاصطناعي، وتأثيره المجتمعي، وتصور الجمهور، والحاجة الماسة للحذر والاستعداد كما حددها الخبراء.
23-05-2025
تحديث ضخم لجهاز Steam Deck من Valve يدعم أجهزة AMD المنافسة
تحديث جديد لجهاز Steam Deck من Valve يدعم أجهزة AMD المحمولة، مع ميزات جديدة وتحسينات في الأداء.
10-07-2025
احتضان السياحة في الشرق الأوسط للتكنولوجيا الغامرة لتحقيق النمو المستقبلي
اكتشف كيف تعمل التقنيات الغامرة على تحويل السياحة والضيافة في الشرق الأوسط، من الجولات الافتراضية إلى خطط الرحلات الشخصية، وتأثيرها على اقتصاد المنطقة.
ADVERTISEMENT
29-05-2025
الأولمبياد الدولي للروبوتات البشرية: من أولمبيا إلى المستقبل الذكي
استعدوا لأحداث مثيرة في أولمبيا، اليونان، حيث سيجمع الأولمبياد الدولي للروبوتات البشرية بين الابتكار والتكنولوجيا في حدث فريد من نوعه.
19-08-2025
الوضع الداكن في ويندوز 11 يحصل على تألق جديد ومطلوب بشدة
يُقال إن مايكروسوفت تعزز الوضع الداكن في ويندوز 11 من خلال تمديده ليشمل مربعات حوار عمليات الملفات، مما يوفر تجربة مستخدم أكثر اتساقًا.
12-08-2025
EngineAI تكشف عن SA02: روبوت بشري بقيمة 5,500 دولار مهيأ ليصبح رفيقًا للشباب
تعلن EngineAI عن الإطلاق الوشيك لـ SA02، وهو روبوت بشري آلي بقيمة 5,500 دولار مصمم للشباب، ويهدف إلى إدخال الروبوتات المتقدمة في الحياة اليومية بميزات مثل التفاعل بالذكاء الاصطناعي والتعرف على الإيماءات.
ADVERTISEMENT
25-07-2025
تصميم "الزجاج السائل" من آبل: هل هو ممل لأجهزة الماك؟
يقدم الإصدار التجريبي العام لنظام macOS Tahoe من Apple تصميم "الزجاج السائل"، لكن المراجعات المبكرة تشير إلى أنه تحديث مخيب للآمال لأجهزة Mac، مع مشاعر متباينة حول تأثيره البصري ووظيفته.
17-06-2025
تقدم ثريدز نصًا مخفيًا لتحسين تجربة المستخدم
تختبر Threads ميزة نصية جديدة لإخفاء المحتوى، أعلن عنها الرئيس التنفيذي لشركة Meta مارك زوكربيرج، مما يسمح للمستخدمين بإخفاء المحتوى لمنع الكشف عن معلومات حساسة وطمسها.
03-06-2025
لا تزل هذا الغشاء البلاستيكي عند فتح جهاز نينتندو سويتش 2 الجديد!
اكتشف لماذا يجب ألا تزيل الغشاء البلاستيكي الواقي عن شاشة نينتندو سويتش 2 الجديد، ونصائح هامة للعناية بالجهاز.
ADVERTISEMENT
29-05-2025
جيم كرامر: الذكاء الاصطناعي قد يكون "القوة الأكثر أهمية" في مستقبل الوظائف
جيم كرامر يتحدث عن تأثير الذكاء الاصطناعي على سوق العمل، محذرًا من زيادة البطالة وفقدان الوظائف، بينما يشير إلى الفوائد المحتملة لهذه التكنولوجيا.
20-05-2025
هل يمكن أن تكون "الذكاء الاصطناعي النظيف" حلاً لمخاوف هوليوود التقنية؟
تستكشف هوليوود إمكانية استخدام "الذكاء الاصطناعي النظيف" كحل لمخاوفها التقنية، مع التركيز على نموذج "ماراي" الذي تم تدريبه بشكل أخلاقي.
25-08-2025
iOS 26 يعزز الشحن اللاسلكي للآيفون 16 إلى 25 واط عبر معيار Qi2
اكتشف كيف يفتح نظام iOS 26 شحنًا لاسلكيًا أسرع بقدرة 25 واط بتقنية Qi2 لسلسلة iPhone 16، مما يوسع التوافق مع الملحقات الخارجية، باستثناء ملحوظ واحد.
ADVERTISEMENT