منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

29-05-2025
جوجل تكشف عن سبب مشاكل بطارية بيكسل بعد تحديث مايو
جوجل تكشف أن مشاكل بطارية هواتف بيكسل بعد تحديث مايو 2025 ناتجة عن خلل في تطبيق إنستغرام، وليس بسبب التحديث نفسه.
ADVERTISEMENT
21-11-2025
مشاركة سريعة مقابل AirDrop: سد فجوة نقل الملفات بين أندرويد وآبل
يجلب تطبيق Quick Share الجديد توافق AirDrop إلى Android، مما يتيح مشاركة الملفات السريعة والآمنة مع أجهزة Apple. تعرف على كيفية مقارنة كليهما في عام 2024.
15-07-2025
يتفاعل مستخدمو X بعدم تصديق مع ميزة الرفيق الجديد "المخيفة" للذكاء الاصطناعي من إيلون ماسك
تقدم منصة X التابعة لإيلون ماسك ميزة "Companions" الجديدة، وهي ميزة ذكاء اصطناعي مع صورة رمزية بأسلوب الأنمي، مما أثار جدلاً حول طبيعتها "المخيفة" وتأثيرها المحتمل على المستخدمين.
14-10-2025
تحديث One UI 8 Watch المستقر لساعة Samsung Galaxy Watch7: ميزات جديدة تصل
يتلقى مستخدمو Samsung Galaxy Watch7 تحديث One UI 8 Watch المستقر، والذي يجلب واجهة محدثة، وميزات صحية جديدة، وتحديث أمني لشهر سبتمبر. تعرف على المزيد حول الميزات الجديدة وطرح التحديث.
ADVERTISEMENT
26-05-2025
نظارات ذكية مدعومة بالذكاء الاصطناعي: هل يمكنها تقليل أخطاء الأدوية؟
تسعى الأبحاث في جامعة واشنطن إلى استخدام الذكاء الاصطناعي في تطوير نظارات ذكية تساعد في تقليل الأخطاء الطبية المتعلقة بالأدوية وتحسين سلامة المرضى.
05-11-2025
أهم اتجاهات الإلكترونيات الاستهلاكية لعام 2025
أهم اتجاهات الإلكترونيات الاستهلاكية لعام 2025
09-08-2025
شركات التكنولوجيا الناشئة في الشرق الأوسط ترتقي عالميًا بابتكارات أصلية
تكتسب الشركات الناشئة في مجال التكنولوجيا بالشرق الأوسط اعترافاً عالمياً بابتكاراتها الأصلية وحلولها القابلة للتطوير، وتعد الإمارات العربية المتحدة مركزاً رئيسياً لهذا القطاع المزدهر.
ADVERTISEMENT
27-10-2025
آيباد برو يستعد للحصول على تبريد متقدم بغرفة بخارية
من المتوقع أن تقدم Apple تبريدًا متقدمًا بغرفة بخارية لجهاز iPad Pro لتعزيز الأداء ومعالجة مخاوف الحرارة أثناء المهام المكثفة، مع توقع إصداره في عام 2027.
13-10-2025
بنك طاقة ضخم بسعة 56,800 مللي أمبير بسعر مخفض إلى 34 دولارًا في صفقة أمازون بعد يوم برايم
تقدم أمازون بنك طاقة ضخم بسعة 56,800 مللي أمبير بسعر 34 دولارًا فقط، وهو خصم بنسبة 78% من سعره الأصلي البالغ 159 دولارًا. تقدم هذه الصفقة، وهي بقايا من يوم برايم، إمكانيات شحن واسعة لأجهزة متعددة مع شحن سريع وميزات أمان.
01-09-2025
Reolink كشاف ضوئي واي فاي النخبة: حل أمني قوي وقابل للتخصيص
مراجعة كاميرا Reolink Elite Floodlight WiFi، مع تسليط الضوء على فيديو 4K الخاص بها، والتخزين المحلي، وخيارات التخصيص الواسعة، والتشغيل بدون اشتراك كحل أمني من الطراز الأول.
ADVERTISEMENT