منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

18-06-2025
جوجل تطلق نماذج Gemini 2.5 AI الجاهزة للإنتاج، مما يكثف التحدي لـ OpenAI
تطلق جوجل نماذج Gemini 2.5 AI الجاهزة للإنتاج، بما في ذلك Pro و Flash و Flash-Lite، لتحدي هيمنة OpenAI على الشركات من خلال تعزيز التفكير والعروض المتدرجة والتسعير القوي.
ADVERTISEMENT
07-07-2025
سامسونج HW-Q990F: الملك المتوج لأنظمة الصوت الشريطية بتقنية Dolby Atmos
اكتشف Samsung HW-Q990F، مكبر الصوت الرئيسي Dolby Atmos لشركة Samsung لعام 2025. يسلط هذا الاستعراض الضوء على صوته الغامر ومضخم الصوت المدمج والميزات المتميزة.
18-07-2025
ثورة الذكاء الاصطناعي: من الروبوتات ميسورة التكلفة إلى النهضة الصناعية
استكشف أحدث التطورات في مجال الذكاء الاصطناعي: روبوتات شبيهة بالبشر بأسعار معقولة، والحرب الشرسة على المواهب في مجال الذكاء الاصطناعي، والتحولات الاقتصادية، والذكاء الفائق الطبي، والدعوات إلى مشاريع صناعية واسعة النطاق لدعم النمو السريع للذكاء الاصطناعي.
26-06-2025
NVIDIA و Foxconn تتطلعان إلى نشر روبوتات بشرية في هيوستن لإنتاج خوادم الذكاء الاصطناعي
تجري NVIDIA و Foxconn محادثات لنشر روبوتات بشرية في منشأة جديدة في هيوستن لتصنيع خوادم الذكاء الاصطناعي، مع توقع بدء الإنتاج بحلول أوائل عام 2026.
ADVERTISEMENT
22-07-2025
يتيح Chrome على iOS تبديلًا سلسًا بين الملفات الشخصية وملفات العمل
يتيح Google Chrome على نظام iOS الآن التبديل السلس بين الملفات الشخصية وملفات العمل لمستخدمي المؤسسات، مما يعزز فصل البيانات وأمانها.
23-05-2025
سام ألتمان: الروبوتات الشبيهة بالبشر قادمة وستبدو كخيال علمي
سام ألتمان يتحدث عن الروبوتات الشبيهة بالبشر وتأثيرها على المستقبل، مشيرًا إلى أنها ستبدو كخيال علمي وتغير سوق العمل.
21-05-2025
سيرجي برين: "ارتكبت الكثير من الأخطاء مع نظارات جوجل"
سيرجي برين يعترف بأخطائه في مشروع نظارات جوجل خلال مؤتمر Google I/O 2025، ويستعرض جهود جوجل الجديدة في تطوير نظارات ذكية بالتعاون مع شركاء استراتيجيين.
ADVERTISEMENT
09-07-2025
هوغنغ فيس تطلق روبوتًا بسعر 299 دولارًا، مهيأة لإحداث ثورة في مجال الروبوتات
تطلق Hugging Face روبوت Reachy Mini مفتوح المصدر بسعر 299 دولارًا، بهدف إضفاء الطابع الديمقراطي على الروبوتات المدعومة بالذكاء الاصطناعي وتعطيل الصناعة بأجهزة يمكن للمطورين الوصول إليها.
21-05-2025
مستقبل الوكلاء الذكيين: كيف تعيد جوجل تشكيل الذكاء الاصطناعي من خلال جيميني ومشروع مارينر
اكتشف كيف تعيد جوجل تشكيل مستقبل الذكاء الاصطناعي من خلال جيميني ومشروع مارينر، مع التركيز على وضع الوكيل والتطبيقات العملية.
28-07-2025
إيران تتخلى عن نظام تحديد المواقع العالمي (GPS) لصالح نظام بيدو الصيني: إعادة تشكيل تكنولوجيا السفر في الشرق الأوسط والسيادة الرقمية
تنتقل إيران من نظام تحديد المواقع العالمي (GPS) إلى نظام بيدو الصيني، مما يؤثر على تكنولوجيا السفر والسيادة الرقمية في الشرق الأوسط. استكشف الآثار المترتبة على السياحة والبنية التحتية الرقمية العالمية.
ADVERTISEMENT
25-07-2025
أمازون تكشف عن جهاز كيندل ملون بسعر معقول ونسخة للأطفال
تقدم أمازون جهاز كيندل ملون بسعر معقول أكثر وإصدار جديد للأطفال، مما يجعل القراءة الإلكترونية النابضة بالحياة في متناول المزيد من المستخدمين.
26-05-2025
ارتفاع مبيعات التكنولوجيا الاستهلاكية في الشرق الأوسط وأفريقيا إلى 68 مليار دولار هذا العام
مبيعات التكنولوجيا الاستهلاكية في الشرق الأوسط وأفريقيا تصل إلى 68 مليار دولار هذا العام، مع تزايد الطلب على الأجهزة الفاخرة والذكية.
30-05-2025
شنغهاي تستضيف مسابقة مهارات الروبوتات البشرية الدولية لعام 2025
تغطية شاملة لمسابقة مهارات الروبوتات البشرية الدولية لعام 2025 في شنغهاي، الصين، مع التركيز على التحديات والابتكارات التكنولوجية.
ADVERTISEMENT
18-06-2025
ليغو تطلق العنان للملك: تأكيد مجموعة غودزيلا الرسمية
وافق ليغو رسميًا على مجموعة غودزيلا التي صممها المعجبون، وهي عبارة عن إبداع ضخم مبني من الطوب مستوحى من عالم الوحوش الأسطوري، وذلك من خلال برنامج الأفكار الخاص بها.
20-06-2025
تجديد الدكتور التاسع لكريستوفر إكليستون: وداع لا ينسى
استكشف لماذا لا يزال تجديد كريستوفر إكليستون للدكتور التاسع أحد أهم اللحظات المحورية والدائمة في مسلسل دكتور هو، بعد 20 عامًا.
29-05-2025
تطبيق T-Mobile الجديد: هل هو أداة لتحسين الخدمة أم انتهاك للخصوصية؟
تطبيق T-Mobile الجديد يثير قلق العملاء حول الخصوصية بعد تفعيل أداة تسجيل الشاشة بشكل افتراضي. تعرف على التفاصيل وكيفية إيقاف تشغيل الأداة.
ADVERTISEMENT