منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

22-05-2025
دايسون تكشف عن مكنسة PencilVac الرقيقة كالسلك
اكتشف مكنسة دايسون الجديدة PencilVac، الأرق في العالم، مع تصميم مبتكر وأداء متفوق. تعرف على ميزاتها وموعد إطلاقها.
ADVERTISEMENT
29-08-2025
تلفزيونات سامسونج تزداد ذكاءً: مساعد Copilot للذكاء الاصطناعي يصل لحل معضلات المشاهدة لديك
تلفزيونات سامسونج أصبحت الآن تتميز بمساعد Copilot المدعوم بالذكاء الاصطناعي من مايكروسوفت، لمساعدة المستخدمين على اكتشاف ما يمكن مشاهدته، والحصول على إجابات للأسئلة، والمزيد.
19-08-2025
إصدار iOS 26 بيتا العامة 4: خطوة أقرب إلى تحديث الآيفون النهائي
أصدرت Apple الإصدار التجريبي العام الرابع من iOS 26، مما يقرب إصلاحات الأخطاء والميزات الجديدة من الإصدار النهائي للآيفون. تعرف على كيفية التنزيل وما يمكن توقعه.
22-09-2025
قابلية إصلاح آيفون إير تتألق: تفكيك iFixit يكشف عن سهولة إصلاح مفاجئة
تفكيك iFixit لهاتف iPhone Air الجديد يظهر أنه قابل للإصلاح بشكل مفاجئ، وحصل على درجة 7/10. تعرف على سهولة استبدال البطارية ومنفذ USB-C المعياري.
ADVERTISEMENT
18-07-2025
أندرويد 16 QPR1 بيتا 3 يكشف عن ميزات Pixel الجديدة
اكتشف الميزات الجديدة في Android 16 QPR1 Beta 3 لأجهزة Pixel، بما في ذلك تكبير لوحة المفاتيح المحسّن وإدارة شريط المهام المبسّطة.
14-08-2025
سامسونج تطلق أول شاشة OLED بدقة QHD ومعدل تحديث 500 هرتز في العالم بالولايات المتحدة؛ كما يتم إطلاق شاشات Odyssey G7 المنحنية الجديدة أيضاً
تطلق سامسونج شاشتها المخصصة للألعاب Odyssey OLED G6 بدقة QHD ومعدل تحديث 500 هرتز في الولايات المتحدة بسعر 999 دولارًا. كما تقدم الشركة شاشتين جديدتين منحنيتين من طراز Odyssey G7، إحداهما بحجم 37 بوصة والأخرى بحجم 40 بوصة.
21-05-2025
جوجل تبدأ في دمج روبوت الدردشة الذكي في محرك البحث
جوجل تعلن عن دمج روبوت الدردشة الذكي في محرك البحث، مما يتيح تجربة محادثة أكثر تعقيدًا للمستخدمين، مع خطط لتطوير نظارات ذكية جديدة.
ADVERTISEMENT
24-06-2025
لقد حصل هاتف Android الخاص بك للتو على ترقية Gemini رئيسية لمحبي الموسيقى
اكتشف كيف حصل مساعد جوجل Gemini AI على هواتف أندرويد على ترقية رئيسية ومجانية لمحبي الموسيقى، مما يتيح التعرف السهل على الأغاني عن طريق الاستماع أو الدندنة.
27-08-2025
نظارات روكيد الذكية الجديدة المزودة بشاشة عرض علوية تنبه ميتا
روكيد تطلق نظارات ذكية جديدة مزودة بشاشة عرض رأسية ومساعد ذكاء اصطناعي، لتتحدى عروض ميتا القادمة بنقطة سعر تنافسية.
08-09-2025
حركات أطلس الجديدة: بوسطن ديناميكس تكشف النقاب عن تطورات في الروبوتات المدربة بشريًا
استكشف كيف تقوم بوسطن ديناميكس بتدريب روبوتها أطلس باستخدام مشغلين بشريين ونماذج ذكاء اصطناعي متقدمة، مع التركيز على المهام العملية والقدرة المحسنة على التكيف.
ADVERTISEMENT
15-07-2025
سوني تكشف النقاب عن سماعات الجيل التالي لمدربي دوري كرة القدم الأمريكية
تكشف سوني عن سماعات رأس جديدة ومتطورة لمدربي دوري كرة القدم الأمريكية، تتميز بإلغاء الضوضاء المحسن والمتانة وعزل الصوت لتحسين التواصل على الخط الجانبي.
29-08-2025
الصين رائدة في تكنولوجيا المفاعلات النووية "المقاومة للانصهار"
تختبر الصين نظام أمان جديد لمفاعلاتها السريعة المتكاملة (IFRs)، بهدف إنشاء محطات طاقة نووية "مقاومة للانصهار" والمضي قدمًا في تحقيق أهدافها المتعلقة بالطاقة النظيفة.
25-08-2025
بيكسل 10 برو فولد مقابل جالكسي زد فولد 7: أي هاتف قابل للطي يسود؟
قارن جوجل بيكسل 10 برو فولد وسامسونج جالكسي زي فولد 7. اكتشف أي هاتف قابل للطي يفوز بناءً على الميزات والسعر ومقاومة الغبار وقدرات الذكاء الاصطناعي والتصميم.
ADVERTISEMENT
11-09-2025
الكشف عن AirPods Pro 3: ميزة إلغاء الضوضاء النشط المحسّنة، الترجمة الفورية، وميزات تتبع الصحة تصل
استكشف الميزات الجديدة لسماعات AirPods Pro 3، بما في ذلك خاصية إلغاء الضوضاء النشط المحسّنة، والترجمة الفورية، وتتبع معدل ضربات القلب. تعرّف على جودة الصوت المحسّنة وتفاصيل الإصدار.
26-08-2025
xAI التابعة لماسك تقاضي OpenAI و Apple بسبب التمييز المزعوم في متجر التطبيقات
تقاضي شركة xAI التابعة لإيلون ماسك شركتي أوبن إيه آي وأبل، مدعيةً التمييز في متجر التطبيقات وممارسات مناهضة للمنافسة تفضل تشات جي بي تي على المنافسين مثل غروك.
12-09-2025
ثقوب سوداء بدائية متفجرة قد تعيد كتابة تاريخ الكون
اكتشف كيف أن الثقوب السوداء البدائية المتفجرة، وفقًا لنموذج نظري جديد، قد تصبح قابلة للرصد قريبًا، مما يتيح فرصة لإعادة كتابة تاريخ الكون.
ADVERTISEMENT