منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

08-12-2025
طائرات DJI بدون طيار تواجه حظرًا أمريكيًا محتملاً قبل العطلات
استكشف الآثار المحتملة لحظر أمريكي على طائرات DJI المسيرة على المالكين الحاليين والمتسوقين في العطلات، بما في ذلك إجراءات لجنة الاتصالات الفيدرالية (FCC) ورد DJI.
ADVERTISEMENT
20-10-2025
روبوت شبيه بالبشر يتجول: فيديو فيروسي يلتقط أعجوبة ميكانيكية في شوارع هولندا
شاهد مقطع فيديو فيروسي لروبوت شبيه بالبشر يسير في شوارع لاهاي، هولندا، برفقة شخص. اكتشف تفاصيل هذه الرحلة الروبوتية غير العادية.
10-09-2025
خلايا دماغ وعضلات حية تشغل روبوتًا حيويًا هجينًا زاحفًا جديدًا
اكتشف الروبوت الحيوي الهجين الثوري المدعوم بخلايا الدماغ والعضلات الحية، والذي يقدم رؤى حول التحكم في الحركة واكتشافات طبية محتملة.
21-05-2025
إطار تنظيم الذكاء الاصطناعي: بين الخوف والتفاؤل
تتناول المقالة كيف يمكن أن يستند إطار تنظيم الذكاء الاصطناعي في ميشيغان إلى الخوف أو التفاؤل، مع تسليط الضوء على الأسئلة الأساسية لصانعي السياسات.
ADVERTISEMENT
23-10-2025
ويكيبيديا تواجه انخفاضًا في حركة المرور وسط صعود ملخصات الذكاء الاصطناعي ومقاطع الفيديو على وسائل التواصل الاجتماعي
تفيد ويكيبيديا بانخفاض كبير في حركة المرور، مستشهدة بالملخصات البحثية المدعومة بالذكاء الاصطناعي والشعبية المتزايدة لمقاطع الفيديو على وسائل التواصل الاجتماعي كأسباب رئيسية.
29-05-2025
اكتشاف كائن كوني غامض يربك علماء الفلك
اكتشاف كائن كوني غامض يُعرف باسم ASKAP J1832-0911، والذي يُظهر إشارات راديوية ونبضات أشعة سينية، مما يثير تساؤلات جديدة حول طبيعة هذه الكائنات.
11-09-2025
ذكاء جوجل الاصطناعي يعلن بالخطأ أن وكالة DOGE التابعة لإيلون ماسك وهمية
وصفت الذكاء الاصطناعي من جوجل وكالة DOGE التابعة لإيلون ماسك بأنها وهمية عن طريق الخطأ، مما أثار الارتباك ودفع عملاق التكنولوجيا إلى الاعتراف بالخطأ.
ADVERTISEMENT
09-08-2025
دليلك الأساسي قبل مشاهدة "Alien: Earth"
استعدوا لـ "Alien: Earth" مع هذا الدليل الذي يغطي أساسيات الزينومورف، وموقعه الزمني، والمؤامرات الشركاتية، ودور الأندرويد في سلسلة الخيال العلمي الجديدة.
12-09-2025
مجموعة أنت تدخل سباق الروبوتات مع إطلاق أول روبوت بشري لها
تكشف مجموعة علي بابا أنت عن أول روبوت بشري لها، R1، والذي يستعرض قدرات ذكاء اصطناعي متقدمة للمهام المعقدة، ويشير إلى طموحاتها في سباق الروبوتات بالصين.
27-08-2025
يوتيوب تتصدى لرد فعل عنيف من المبدعين بسبب تعديلات الفيديو المزعومة بالذكاء الاصطناعي
تتصدى يوتيوب لمخاوف المبدعين بشأن تعديل الذكاء الاصطناعي لمقاطع فيديو Shorts، وتعلن عن خطط لميزة إلغاء الاشتراك وسط نقاشات حول الشفافية والأصالة.
ADVERTISEMENT