منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

15-08-2025
بكتيريا آكلة للحوم تصيب سباحًا في شاطئ فالموث
أصيب سباح في فالماوث، ماساتشوستس، ببكتيريا آكلة للحوم، وهي بكتيريا الضمة اللاهوائية (Vibrio vulnificus)، بعد السباحة في شاطئ أولد سيلفر. تعرف على المخاطر والوقاية.
ADVERTISEMENT
19-02-2026
الحدود الجديدة لألعاب الماك: المحاكاة من طرف ثالث مقابل الدعم الأصلي
تعمق في كيفية قيام محاكاة الطرف الثالث لمعمارية x86 مثل Fex بإحداث ثورة في ألعاب Mac، مع مقارنة إمكاناتها مقابل استراتيجية الدعم الأصلي لشركة Apple.
12-03-2026
شائعات حول هاتف آيفون القابل للطي من آبل: ميزات تعدد مهام شبيهة بالآيباد ومستشعر بصمات الأصابع جانبي
استكشف أحدث الشائعات حول هاتف آبل القابل للطي، بما في ذلك ميزات تعدد المهام الشبيهة بالآيباد، ومستشعر بصمات الأصابع المثبت على الجانب، والسعر المحتمل البالغ 2000 دولار.
12-09-2025
ثقوب سوداء بدائية متفجرة قد تعيد كتابة تاريخ الكون
اكتشف كيف أن الثقوب السوداء البدائية المتفجرة، وفقًا لنموذج نظري جديد، قد تصبح قابلة للرصد قريبًا، مما يتيح فرصة لإعادة كتابة تاريخ الكون.
ADVERTISEMENT
04-09-2025
شعلة بلازما الهيدروجين تقضي على النفايات البلاستيكية في أجزاء من الثانية
اكتشف كيف تفكك شعلة بلازما جديدة تعمل بالهيدروجين من KIMM النفايات البلاستيكية في أجزاء من الثانية، وتحولها إلى مواد خام قيّمة بأقل تأثير بيئي.
06-01-2026
الاتجاهات التكنولوجية الرئيسية: صعود شاشات NXTPAPER الصديقة للعين من TCL
استكشف أحدث ترقيات TCL NXTPAPER واكتشف الاتجاهات الرئيسية في الشاشات الصديقة للعين، والشاشات متعددة الأوضاع، وإنتاجية الذكاء الاصطناعي في الهواتف الذكية والأجهزة اللوحية.
03-02-2026
روبوت يسرق الأضواء في موكب رأس السنة الصينية في باريس
أصبح روبوت شبيه بالبشر نجمًا غير متوقع في موكب رأس السنة الصينية في باريس، مما يدل على التكامل المتزايد للتكنولوجيا المتقدمة في الاحتفالات الثقافية وسط طفرة عالمية في تطوير الروبوتات.
ADVERTISEMENT
16-10-2025
جوجل تقدم ميزة "اتصل بصديق" لاستعادة الحساب
تتيح ميزة "جهات اتصال الاسترداد" الجديدة من جوجل للمستخدمين تعيين أصدقاء موثوق بهم لمساعدتهم في استعادة حساباتهم. تعرف على هذه الميزة وغيرها من إجراءات الأمان الجديدة من جوجل.
07-01-2026
ريزر تكشف عن مشروع موتوكو: سماعة رأس للألعاب تعمل بالذكاء الاصطناعي في معرض الإلكترونيات الاستهلاكية 2026
تكشف Razer عن Project Motoko، وهو مفهوم مبتكر لسماعات الألعاب مدعومة بالذكاء الاصطناعي في معرض الإلكترونيات الاستهلاكية 2026، ويتميز بقدرات ذكية مثل التعرف على الأشياء في الوقت الفعلي وترجمة اللغات.
23-05-2025
ترامب يجلب الذكاء الاصطناعي إلى الشرق الأوسط بدلاً من الديمقراطية
تقرير عن زيارة ترامب للشرق الأوسط التي تركز على التكنولوجيا بدلاً من الديمقراطية، مع التركيز على صفقة الرقائق المتقدمة والمنافسة مع الصين.
ADVERTISEMENT