منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

12-06-2025
الملحمة التي استمرت عقودًا: الكشف عن بناء نجمة الموت
استكشف البناء المعقد الذي استمر لعقود لـ
ADVERTISEMENT
24-06-2025
تطبيق Xbox للكمبيوتر يدمج الآن ألعاب Steam الخاصة بك
يتكامل تطبيق Xbox للكمبيوتر الشخصي الآن مع ألعاب Steam، بهدف أن يصبح مشغلًا عالميًا. تعكس هذه الخطوة استراتيجية Microsoft لتوسيع نظامها البيئي للألعاب عبر منصات الكمبيوتر الشخصي والأجهزة المحمولة والسحابة.
20-05-2025
إطلاق وكالة الفضاء الأفريقية لتعزيز بيانات المناخ
أفريقيا تؤسس وكالة الفضاء الأفريقية لتعزيز بيانات المناخ ومراقبة الأرض، في خطوة هامة لمواجهة تحديات تغير المناخ.
11-08-2025
إصدار ويندوز 11 كاناري يحسّن إعدادات البحث لتعزيز تحكم المستخدم
قامت مايكروسوفت بتبسيط إعدادات بحث ويندوز في أحدث إصدار من ويندوز 11 Canary، حيث قامت بدمج عناصر التحكم لتجربة مستخدم أفضل مع معالجة الأخطاء وتقديم مشكلات معروفة جديدة.
ADVERTISEMENT
13-06-2025
نينتندو سويتش 2: منارة للبساطة في عالم من التضخم التكنولوجي
تتحدى نينتندو سويتش 2 اتجاه 'التحول إلى الأسوأ' من خلال تقديم تجربة محسنة وسهلة الاستخدام، مع التركيز على التحسينات الأساسية بدلاً من الميزات غير الضرورية.
29-05-2025
ميتا تعيد تنظيم فريق الذكاء الاصطناعي لتعزيز إطلاق المنتجات
ميتا تعلن عن إعادة تنظيم فريق الذكاء الاصطناعي لتعزيز إطلاق المنتجات، مع استثمار كبير في البنية التحتية وتحديات في الاحتفاظ بالمواهب.
14-08-2025
الروبوتات البشرية على وشك تحقيق قفزة كبيرة إلى الأمام في السنوات الثلاث إلى الخمس القادمة، حسبما تقول يونيتري
تتوقع شركة Unitree الصينية المصنعة للروبوتات الشبيهة بالبشر تقدمًا كبيرًا في الصناعة خلال 3-5 سنوات، مدفوعًا بالذكاء الاصطناعي وتحسينات الأجهزة، مما قد يحدث ثورة في قطاعات مثل التصنيع والرعاية الصحية.
ADVERTISEMENT
23-07-2025
حقق روبوت Walker S2 من UBTech تبديلًا ذاتيًا للبطارية، مما يمهد الطريق للإنسان الآلي المستدام ذاتيًا
اكتشف كيف يمكن للروبوت البشري Walker S2 من UBTech تغيير بطاريته ذاتيًا بشكل مستقل، مما يمثل قفزة كبيرة نحو الروبوتات المستدامة ذاتيًا ويلمح إلى مستقبل من الآلات المستقلة.
24-07-2025
سرعة شحن Galaxy S26 Ultra مُعدة لترقية كبيرة تتجاوز 45 واط، حسبما يدعي مُسرب
يُشاع أن هاتف سامسونج جالاكسي إس 26 ألترا سيحصل على ترقية في سرعة الشحن تتجاوز 45 واط، وفقًا لمسرب موثوق. اكتشف ما يعنيه ذلك لهاتف سامسونج الرائد.
09-08-2025
شركات التكنولوجيا الناشئة في الشرق الأوسط ترتقي عالميًا بابتكارات أصلية
تكتسب الشركات الناشئة في مجال التكنولوجيا بالشرق الأوسط اعترافاً عالمياً بابتكاراتها الأصلية وحلولها القابلة للتطوير، وتعد الإمارات العربية المتحدة مركزاً رئيسياً لهذا القطاع المزدهر.
ADVERTISEMENT
11-06-2025
المخرج ديبلوا يكشف عن تطور شخصية ستويك التي يؤديها جيرارد بتلر في فيلم 'كيف تدرب تنينك' الواقعي
يناقش المخرج دين ديبلوا تعميق شخصية ستويك التي يؤديها جيرارد بتلر في فيلم
24-06-2025
مرصد روبين يكشف عن أولى صوره المذهلة
يكشف مرصد فيرا سي. روبين عن صوره الأولى، التي تعرض ملايين المجرات والنجوم وآلاف الكويكبات الجديدة، مما يبشر بثورة في علم الفلك.
05-08-2025
بكتيريا قاتلة تُحدَّد كسبب لنفوق نجم البحر الجماعي
حدد العلماء المسبب البكتيري وراء مرض هزال نجم البحر المدمر الذي أودى بحياة مليارات من نجوم البحر، مما يبعث الأمل في جهود الحفظ المستقبلية.
ADVERTISEMENT
12-06-2025
أداة الفيديو الجديدة بالذكاء الاصطناعي من ميتا: تحولات فورية لمقاطعك
تطلق Meta أدوات جديدة لتحرير الفيديو بالذكاء الاصطناعي مع أكثر من 50 موجهًا مسبقًا، مما يسمح للمستخدمين بتحويل سمات الفيديو والخلفيات والملابس. تتوفر الميزة لفترة محدودة، ويتم طرحها في الولايات المتحدة وبلدان أخرى.
02-07-2025
يكشف الحمض النووي القديم عن المكون السري لصلصة السمك الرومانية: السردين
استخدم العلماء الحمض النووي القديم للكشف عن المكون السري للجاروم الروماني، وكشفوا أن السردين الأوروبي كان أساسيًا. يقدم هذا الاكتشاف رؤى حول النظام الغذائي الروماني ويفتح طرقًا جديدة للبحث الأثري.
17-07-2025
زئير التنين: فيلم الحركة الحية "كيف تروض تنينك" يصل إلى المنصات الرقمية مع إضافات واسعة
من المقرر إطلاق فيلم الحركة الحية "How to Train Your Dragon" رقميًا في 15 يوليو، وهو مليء بأكثر من 75 دقيقة من الميزات الإضافية، بما في ذلك المشاهد المحذوفة ومحتوى من وراء الكواليس. يتم بالفعل تطوير جزء ثانٍ.
ADVERTISEMENT