منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

02-07-2025
الألعاب العالمية للروبوتات الشبيهة بالبشر تكشف عن فعاليات جديدة رائدة
اكتشف فعاليات المنافسة الجديدة والمثيرة التي كشفت عنها ألعاب الروبوتات البشرية العالمية، والتي تدفع حدود قدرات الروبوتات البشرية في الرشاقة والدقة والتعاون.
ADVERTISEMENT
11-06-2025
فك شفرة الواقع: كيف يرى روبوت أطلس من بوسطن ديناميكس العالم
اكتشف كيف يدرك روبوت أطلس البشري من بوسطن ديناميكس بيئته ويتفاعل معها من خلال دمج المستشعرات المتقدم ورسم الخرائط في الوقت الفعلي.
29-05-2025
نمو الذكاء الاصطناعي في الفصول الدراسية: محاضرة ستيفن سيسيريللي
محاضرة ستيفن سيسيريللي تناقش تأثير الذكاء الاصطناعي على التعليم وكيف يمكن أن يعزز تجربة التعلم للطلاب.
02-07-2025
+Apple TV تكشف النقاب عن النظرة الأولى لمسلسل 'Neuromancer'
تكشف Apple TV+ عن نظرة أولى لسلسلة "Neuromancer" الخاصة بها، والتي تعرض عالم ويليام جيبسون السيبراني المروع المضاء بالنيون. اكتشف الممثلين والطاقم والتفاصيل المبكرة.
ADVERTISEMENT
12-06-2025
HP تكشف عن مؤتمرات ثلاثية الأبعاد مدعومة بالذكاء الاصطناعي مع Google Beam: لمحة عن مستقبل العمل عن بعد
اكتشف حل المؤتمرات ثلاثي الأبعاد الجديد المدعوم بالذكاء الاصطناعي من HP، وهو HP Dimension مع Google Beam. تعرف على كيفية إنشاء هذه الشاشة التي تبلغ تكلفتها 25000 دولار تفاعلات افتراضية نابضة بالحياة بدون سماعات رأس VR، مما يعزز التركيز واستدعاء الذاكرة في الاجتماعات عن بعد.
27-05-2025
هل يمكن للذكاء الاصطناعي حل أزمة المناخ؟
تستعرض المقالة الشكوك حول قدرة الذكاء الاصطناعي، مثل ChatGPT، على حل أزمة المناخ، مع التركيز على زيادة الانبعاثات والتقنيات الحالية المتاحة.
12-06-2025
تلقى ChatGPT هزيمة: أتاري 2600 القديم يهزم الذكاء الاصطناعي الحديث في مواجهة الشطرنج
هزم ChatGPT في مباراة شطرنج من قبل جهاز أتاري 2600 من حقبة السبعينيات، مما يسلط الضوء على قيود نماذج اللغة في الألعاب الاستراتيجية.
ADVERTISEMENT
02-07-2025
سريع وغاضب: الطريق ينتهي لملحمة الأوكتان العالية
من المقرر أن تختتم سلسلة أفلام Fast & Furious بفيلم Fast XI في عام 2027، وتواجه انتقادات بسبب الأجزاء الأخيرة وتراجع ملحوظ في الجودة.
09-06-2025
Dreame X50 Ultra: مكنسة روبوت قوية مع عيب واحد صارخ
اكتشف أداء المكنسة الكهربائية والروبوتية Dreame X50 Ultra، من شفطها القوي ومسحها الهادئ إلى ميزاتها المتقدمة وقيودها الملحوظة في تنظيف الحواف.
25-06-2025
تمكن Gemini AI الروبوتات الشبيهة بالبشر من الذكاء دون اتصال بالإنترنت
تقدم Google DeepMind نموذج Gemini Robotics On-Device، وهو نموذج ذكاء اصطناعي يمكّن الروبوتات الشبيهة بالبشر من العمل بشكل مستقل دون الحاجة إلى الإنترنت، مما يعزز الموثوقية والخصوصية.
ADVERTISEMENT
29-05-2025
قفزة في إيرادات إنفيديا إلى 44.1 مليار دولار رغم قيود رقائق الذكاء الاصطناعي
إنفيديا تحقق إيرادات قياسية بلغت 44.1 مليار دولار في الربع الأخير، على الرغم من القيود المفروضة على مبيعات رقائق الذكاء الاصطناعي إلى الصين.
25-06-2025
الرجل الحديدي في الحياة الواقعية: أول روبوت بشري يعمل بالطاقة النفاثة في العالم يحلق في السماء
أجرى المعهد الإيطالي للتكنولوجيا (IIT) بنجاح أول رحلة لـ iRonCub3، أول روبوت بشري يعمل بالطاقة النفاثة في العالم، مما يمثل قفزة كبيرة في مجال الروبوتات.
26-05-2025
تأثير مراكز بيانات الذكاء الاصطناعي على البيئة: أزمة الطاقة المتزايدة
تتناول هذه المقالة تأثير مراكز بيانات الذكاء الاصطناعي على البيئة، مع التركيز على زيادة الطلب على الطاقة وتأثيره على انبعاثات غازات الدفيئة.
ADVERTISEMENT
16-06-2025
D-Robotics تكشف عن RDK S100: إحداث ثورة في ذكاء الروبوتات باستخدام مجموعة SoC المتكاملة
تطلق D-Robotics مجموعة RDK S100، وهي مجموعة شرائح متكاملة للروبوتات، تدمج وحدة المعالجة المركزية (CPU) ووحدة المعالجة العصبية (BPU) ووحدة التحكم الدقيقة (MCU) لتعزيز الذكاء المتجسد وتبسيط عملية التطوير.
13-06-2025
بكين تكشف النقاب عن أول متجر 4S في العالم للروبوتات الشبيهة بالبشر
تستعد بكين لافتتاح أول متجر 4S في العالم للروبوتات البشرية خلال المؤتمر العالمي للروبوتات 2025، والذي سيجمع بين المبيعات والخدمة وقطع الغيار وملاحظات العملاء لإحداث ثورة في الصناعة.
27-05-2025
إيلون ماسك يكشف عن روبوتات أوبتيموس البشرية في السعودية، ويعد بمستقبل مع C-3PO الخاص بك
إيلون ماسك يكشف عن روبوتات أوبتيموس في السعودية، مما يثير جدلاً حول حقوق الإنسان والشراكة مع النظام السعودي.
ADVERTISEMENT