منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

18-06-2025
الروبوتات باريستا تُحدث ثورة في الخدمة بفضل الذكاء الاصطناعي المتقدم والوعي بالعملاء
تُحدث الروبوتات البشرية المدعومة بالذكاء الاصطناعي من Richtech Robotics، آدم وسكوربيون، ثورة في صناعة الخدمات من خلال اكتشاف العملاء وإعداد المشروبات بكفاءة.
ADVERTISEMENT
17-07-2025
يتفوق ChatGPT على Microsoft Copilot بعشرة أضعاف
تجاوز عدد تنزيلات ChatGPT الخاص بـ OpenAI 900 مليون عملية تنزيل، مما ترك Copilot الخاص بـ Microsoft متخلفًا بفارق كبير. استكشف الأرقام والأخطاء والآثار المترتبة على استراتيجية Microsoft للذكاء الاصطناعي.
25-06-2025
محامو إيلون ماسك يدعون أنه لا يمتلك جهاز كمبيوتر، مما يثير الجدل في دعوى قضائية ضد OpenAI
يزعم محامو إيلون ماسك أنه لا يمتلك جهاز كمبيوتر في دعوى قضائية، مما يتناقض مع تصريحاته العلنية ويثير تساؤلات حول الدعوى القضائية المستمرة مع OpenAI.
17-07-2025
روبوتات توصيل الوجبات الخفيفة تجوب مترو شنتشن لإعادة تخزين متاجر سفن إيليفن
تقوم الروبوتات المستقلة بركوب مترو أنفاق شنتشن لتوصيل وإعادة تخزين متاجر 7-Eleven، وعرض الخدمات اللوجستية المدفوعة بالذكاء الاصطناعي مع LiDAR، والإرسال الذكي، وتصميم هيكل جديد.
ADVERTISEMENT
23-05-2025
آبل تخطط لإطلاق نظارات ذكية في 2026 وتلغي ساعة ذكية بكاميرا
تستعد آبل لإطلاق نظارات ذكية بحلول 2026، بينما ألغت خططها لإنتاج ساعة ذكية بكاميرا. تعرف على تفاصيل المشروع وتوجهات الشركة نحو الذكاء الاصطناعي.
30-05-2025
صعود لابوبو الفيروسي: المضاربون يفسدون متعة الجمع
تُواجه شخصيات لابوبو المحبوبة من بوب مارت تحديات كبيرة بسبب تزايد نشاط البائعين والمضاربين، مما أدى إلى فوضى في المتاجر وعلى الإنترنت.
08-07-2025
الإنسان الآلي زايون يذهل ديترويت وينتشر بسرعة
روبوت شبيه بالبشر يدعى Zion يمشي في شوارع ديترويت، ويفاجئ المارة ويثير مناقشات واسعة الانتشار، كجزء من مبادرة لتعزيز الروبوتات وإلهام الشباب.
ADVERTISEMENT
24-07-2025
شاحن Qi2 اللاسلكي بقوة 25 واط يصل لأجهزة الآيفون والأندرويد، واعدًا بسرعات أعلى
اكتشف وصول الشحن اللاسلكي Qi2 بقوة 25 واط، مما يوفر سرعات أسرع لأجهزة iPhone والهواتف الذكية الرائدة التي تعمل بنظام Android، بالإضافة إلى الأجهزة المعتمدة الأخرى.
30-06-2025
الاستيلاء على الذكاء الاصطناعي: الرؤساء التنفيذيون يؤكدون أن وظيفتك على المحك
استكشف كيف يشير كبار الرؤساء التنفيذيين في مجال التكنولوجيا بهدوء إلى أن الذكاء الاصطناعي سيحل محل الوظائف البشرية، وليس فقط يعززها، مما يؤدي إلى تسريع عمليات التسريح على الرغم من القوة الاقتصادية.
24-07-2025
آيك بارينهولتز يجسد دور إيلون ماسك في دراما الذكاء الاصطناعي "Artificial" للمخرج لوكا غواداغنينو
إيك بارينهولتز في محادثات للعب دور إيلون ماسك في فيلم الذكاء الاصطناعي القادم للوكا غواداغنينو "Artificial"، والذي من المتوقع أن يركز على أزمة قيادة OpenAI.
ADVERTISEMENT
22-05-2025
نقاش حر حول الذكاء الاصطناعي في سان فرانسيسكو: هل ستنجو الحقيقة؟
نقاش حر حول تأثير الذكاء الاصطناعي على الحقيقة في سان فرانسيسكو، حيث اجتمع 900 شخص لمناقشة الآراء المتباينة بين التفاؤل والتشاؤم.
15-07-2025
ظهور قمر صناعي صيني سري في مدار غير مسبوق بعد اختفاء دام أسبوعًا
اختفى قمر صناعي صيني سري، شييان-28 بي 01، لمدة ستة أيام بعد الإطلاق قبل أن يظهر مجددًا في مدار منخفض غير مسبوق، مما أثار تكهنات حول الغرض منه.
28-07-2025
تسريبات كاميرا آيفون 17 برو تشير إلى زوم 8x وتطبيق احترافي وزر جديد
استكشف الشائعات غير المؤكدة حول الترقيات المحتملة لكاميرا iPhone 17 Pro، بما في ذلك تقريب بصري 8x، وتطبيق كاميرا احترافي، وزر تحكم إضافي.
ADVERTISEMENT
13-06-2025
نينتندو سويتش 2: منارة للبساطة في عالم من التضخم التكنولوجي
تتحدى نينتندو سويتش 2 اتجاه 'التحول إلى الأسوأ' من خلال تقديم تجربة محسنة وسهلة الاستخدام، مع التركيز على التحسينات الأساسية بدلاً من الميزات غير الضرورية.
22-05-2025
مهمة أكس-4 الخاصة إلى محطة الفضاء الدولية تنطلق في 8 يونيو
تستعد أكسيوم سبيس لإطلاق مهمتها الخاصة الرابعة إلى محطة الفضاء الدولية في 8 يونيو، مع طاقم دولي مكون من أربعة رواد فضاء، مما يمثل خطوة مهمة في مجال الفضاء الخاص.
03-07-2025
فيلم "سوبرمان" لجيمس غان: الكشف عن مستقبل عالم دي سي
اكتشف كيف سيعيد فيلم "سوبرمان" القادم لجيمس غان تعريف عالم دي سي، مقدمًا رؤية جديدة واحتضانًا لسرد القصص المتنوع.
ADVERTISEMENT