منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

30-10-2025
كسر حاجز سعر أقراص SSD: قرص Crucial P310 1TB NVMe أرخص الآن من الأقراص الصلبة القديمة
أصبح قرص Crucial P310 NVMe SSD بسعة 1 تيرابايت متاحًا بسعر 69 دولارًا، مما يجعله أرخص من الأقراص الصلبة التقليدية ويوفر تحسينات كبيرة في السرعة لأجهزة الكمبيوتر المكتبية والمحمولة.
ADVERTISEMENT
02-10-2025
ستقدم واجهة One UI 8.5 من سامسونج ملخصات إشعارات مدعومة بالذكاء الاصطناعي لأجهزة Galaxy
سيقدم تحديث One UI 8.5 من سامسونج لأجهزة Galaxy ملخصات إشعارات مدعومة بالذكاء الاصطناعي، مما يوفر طريقة أكثر ملاءمة لاستيعاب التنبيهات. تعرف على المزيد حول هذه الميزة القادمة.
17-10-2025
Pinterest تكشف عن أداة 'Tuner' لمنح المستخدمين مزيدًا من التحكم في المحتوى الذي يولده الذكاء الاصطناعي في خلاصاتهم
تقدم بينترست أداة "موالف" جديدة تسمح للمستخدمين بتقليل المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي في خلاصاتهم عبر فئات مختلفة مثل الجمال والفن والأزياء. تعرف على كيفية استخدامها وقيودها.
05-09-2025
Huawei تكشف عن الجيل الثاني من هاتف Mate XTs القابل للطي ثلاثي الطيات قبل هاتف سامسونج القابل للطي القادم
Huawei تطلق هاتف Mate XTs، هاتفها الثلاثي المطوي المحسن، قبل أسابيع من طرح سامسونج لهاتفها القابل للطي. يتميز الطراز الجديد بدعم القلم الذكي، وتحسين تعدد المهام، وأحدث معالج Kirin 9020، بسعر يبدأ من 2,520 دولار.
ADVERTISEMENT
18-09-2025
لا تفوت أي لحظة: الذكاء الاصطناعي "اسأل Gemini" من Google Meet يلخص لك المحادثات الفائتة
تقدم Google Meet ميزة "اسأل Gemini"، وهي مساعد ذكاء اصطناعي مصمم لتلخيص المحادثات الفائتة والإجابة على الأسئلة أثناء المكالمات، مما يعزز الإنتاجية لمستخدمي Workspace.
09-10-2025
نظرة عملية على ساعة بيكسل 4: جوجل تمزج بين الأناقة والترقيات القوية
اكتشف كيف أن ساعة Pixel Watch 4 من Google تثير الإعجاب بفضل الذكاء الاصطناعي الأذكى، والشحن الأسرع، وميزات الأمان عبر الأقمار الصناعية، والتصميم الأنيق—مما يجعلها خياراً رائعاً كساعة ذكية تعمل بنظام أندرويد.
22-05-2025
مايكروسوفت تضيف أكثر من 50 لعبة كلاسيكية إلى Game Pass
مايكروسوفت تضيف أكثر من 50 لعبة كلاسيكية إلى Game Pass، تشمل ألعاب من Activision من الثمانينيات والتسعينيات، مع التزام بالحفاظ على الألعاب والتوافق مع الإصدارات السابقة.
ADVERTISEMENT
18-06-2025
شركات الروبوتات البشرية في الصين تقدم رواتب خيالية وسط صراع على مواهب الذكاء الاصطناعي
تدفع شركات الروبوتات البشرية الصينية للمهندسين ومواهب الذكاء الاصطناعي أكثر من ثلاثة أضعاف المتوسط الوطني بسبب نقص حاد في المواهب، مما يسلط الضوء على طلب القطاع المزدهر على المهارات المتخصصة.
29-09-2025
روبوت بشري يتقن الشقلبات الجانبية، مستعرضًا رشاقة متقدمة
يُظهر الروبوت البشري فورييه N1 رشاقة مبهرة بأداء الشقلبات الجانبية، مُبرزًا عتاده المتقدم وإمكانات برمجته مفتوحة المصدر للمطورين والباحثين.
03-07-2025
تطهير كلمات مرور Microsoft: ما تحتاج إلى القيام به قبل أغسطس
تتخلص Microsoft تدريجيًا من دعم كلمات المرور في تطبيق Authenticator الخاص بها بحلول أغسطس 2025، وتحث المستخدمين على التبديل إلى مفاتيح المرور الأكثر أمانًا. تعرف على سبب كون مفاتيح المرور أكثر أمانًا وكيفية إجراء هذا الانتقال.
ADVERTISEMENT