منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

28-07-2025
تسريبات كاميرا آيفون 17 برو تشير إلى زوم 8x وتطبيق احترافي وزر جديد
استكشف الشائعات غير المؤكدة حول الترقيات المحتملة لكاميرا iPhone 17 Pro، بما في ذلك تقريب بصري 8x، وتطبيق كاميرا احترافي، وزر تحكم إضافي.
ADVERTISEMENT
10-06-2025
كشف غرفة الصدى: لماذا تعزز روبوتات الدردشة المدعومة بالذكاء الاصطناعي معتقداتك
تكشف دراسة جديدة لماذا غالبًا ما تعزز روبوتات الدردشة المدعومة بالذكاء الاصطناعي مثل ChatGPT المعتقدات الحالية، مما يقود المستخدمين إلى متاهات معلوماتية. تعرف على كيفية مساهمة تحيزات المستخدم وتصميم المنصة في "تأثير البحث الضيق" هذا واكتشف استراتيجيات للحصول على مجموعة أكثر توازنًا من المعلومات.
15-07-2025
تستحوذ Google AI: استبدال ميزة "لمحة سريعة" في Pixel بـ "مساحة Gemini"
أفادت التقارير أن Google تستبدل أداة Pixel "في لمحة" بـ "مساحة Gemini"، وهي ميزة مدعومة بالذكاء الاصطناعي تقدم معلومات مخصصة مثل نتائج المباريات الرياضية وأعياد الميلاد والمزيد.
12-06-2025
جولي كيت تستعد: ترقيات عصا التحكم لـ Switch 2 قيد العمل بالفعل
تعمل GuliKit بالفعل على تطوير ترقيات لذراع التحكم لجهاز Nintendo Switch 2، لمعالجة مخاوف الانجراف المحتملة حيث من المتوقع أن يستخدم الجهاز الجديد تقنية ذراع التحكم المشابهة لسلفه.
ADVERTISEMENT
05-08-2025
الروبوتات الشبيهة بالبشر على وشك إحداث ثورة في صناعة الروبوتات
الروبوتات الشبيهة بالبشر على وشك إحداث ثورة في صناعة الروبوتات، مع مقاطع الفيديو الفيروسية وجهود الشركات التي تسلط الضوء على إمكاناتها. اكتشف تأثير هذه الآلات المتطورة.
26-05-2025
هل يمكن للذكاء الاصطناعي حل أزمة الغذاء العالمية القادمة؟
تستعرض المقالة كيف يمكن للذكاء الاصطناعي أن يسهم في حل أزمة الغذاء العالمية المتزايدة بحلول عام 2050، مع التركيز على أهمية التعاون بين التخصصات.
26-06-2025
الذكاء الاصطناعي يحيي فيلم 'ساحر أوز' في ذا سفير، مما يثير جدلاً حول الحفاظ على الأفلام
يأتي فيلم ساحر أوز إلى ذا سفير في لاس فيغاس، باستخدام الذكاء الاصطناعي لتكييف الفيلم الكلاسيكي مع المكان الغامر. تثير هذه الخطوة جدلاً حول الحفاظ على الأفلام والتحسين التكنولوجي.
ADVERTISEMENT
22-05-2025
دراسة جديدة من آبل تعلم الروبوتات كيفية التصرف من خلال مشاهدة البشر
تستعرض دراسة جديدة من آبل كيفية تدريب الروبوتات على التصرف من خلال مشاهدة البشر، باستخدام تقنيات متقدمة لجمع البيانات وتحسين الأداء.
10-07-2025
احتضان السياحة في الشرق الأوسط للتكنولوجيا الغامرة لتحقيق النمو المستقبلي
اكتشف كيف تعمل التقنيات الغامرة على تحويل السياحة والضيافة في الشرق الأوسط، من الجولات الافتراضية إلى خطط الرحلات الشخصية، وتأثيرها على اقتصاد المنطقة.
09-07-2025
تُزيح VITURE الستار عن تشكيلة نظارات ذكية رائدة
تُزيح VITURE الستار عن سلسلة Luma الجديدة ونظارات Beast الذكية، التي تتميز بلوحات Sony micro-OLED لتجربة بصرية تشبه دقة 4K وقدرات XR متقدمة.
ADVERTISEMENT
17-06-2025
وكالة ناسا توافق على مهمة خاصة لمحطة الفضاء الدولية بعد إصلاح تسرب الهواء
وكالة ناسا توافق على مهمة خاصة لمحطة الفضاء الدولية بعد إصلاحات ناجحة لتسرب الهواء في وحدة زفيزدا الروسية، مما يمهد الطريق لمهمة أكسيوم 4.
20-05-2025
إطلاق وكالة الفضاء الأفريقية لتعزيز بيانات المناخ
أفريقيا تؤسس وكالة الفضاء الأفريقية لتعزيز بيانات المناخ ومراقبة الأرض، في خطوة هامة لمواجهة تحديات تغير المناخ.
07-07-2025
الروبوتات الشبيهة بالبشر في الفنادق: سلاح ذو حدين من الابتكار والقلق
استكشف الاتجاه المتزايد للروبوتات الشبيهة بالبشر في الفنادق، مع فحص فوائدها وتحدياتها مثل تأثير "الوادي الغريب"، ومستقبل التعاون بين الإنسان والروبوت في مجال الضيافة.
ADVERTISEMENT
17-06-2025
سبوتيفاي يُحدث ثورة في تنزيل الموسيقى لساعات Wear OS الذكية
تبسّط Spotify تنزيل الموسيقى لساعات Wear OS الذكية، مما يسمح لمستخدمي Premium بإرسال الأغاني مباشرة من هواتفهم التي تعمل بنظام Android، مما يعزز الراحة للاستماع دون اتصال بالإنترنت.
28-05-2025
دراسة جديدة تكشف كيفية تشكيل الكواكب ذات المدارات الواسعة، مما يدعم وجود الكوكب التاسع
دراسة جديدة تكشف كيفية تشكيل الكواكب ذات المدارات الواسعة، مما يدعم وجود الكوكب التاسع في نظامنا الشمسي.
26-06-2025
روبوتات Apptronik 'الخارقة': إعادة تعريف العمل الشاق
روبوتات أبترونيك 'الخارقة' تستعد لإحداث ثورة في الأعمال الشاقة، ودفع الأتمتة إلى ما وراء الحدود البشرية وتحويل الصناعات بقدرات متقدمة.
ADVERTISEMENT