منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

18-06-2025
الروبوتات باريستا تُحدث ثورة في الخدمة بفضل الذكاء الاصطناعي المتقدم والوعي بالعملاء
تُحدث الروبوتات البشرية المدعومة بالذكاء الاصطناعي من Richtech Robotics، آدم وسكوربيون، ثورة في صناعة الخدمات من خلال اكتشاف العملاء وإعداد المشروبات بكفاءة.
ADVERTISEMENT
11-06-2025
اختبار التزود بالوقود المداري الصيني: تغيير قواعد اللعبة تحت التدقيق الأمريكي
تجري الصين اختبارًا حاسمًا للتزود بالوقود في المدار في المدار الثابت بالنسبة للأرض، وهي خطوة يمكن أن تطيل عمر الأقمار الصناعية بشكل كبير، بينما يراقب قمران صناعيان أمريكيان المناورة الاستراتيجية عن كثب.
22-05-2025
عودة فورتنايت إلى متجر آبل: انتصار "لا يقدر بثمن"
تيم سويني، الرئيس التنفيذي لشركة إبيك غيمز، يصف عودة فورتنايت إلى متجر آبل بأنها انتصار "لا يقدر بثمن" بعد خمس سنوات من النزاع القانوني.
23-06-2025
روبوتاكسي تسلا ينطلق في أوستن: رهان بتريليون دولار
تطلق تسلا خدمة سيارات الأجرة الروبوتية في أوستن، تكساس، مما يمثل خطوة مهمة في رؤية إيلون ماسك لمستقبل الشركة في الذكاء الاصطناعي والروبوتات، وسط منافسة شرسة.
ADVERTISEMENT
23-05-2025
سام ألتمان: الروبوتات الشبيهة بالبشر قادمة وستبدو كخيال علمي
سام ألتمان يتحدث عن الروبوتات الشبيهة بالبشر وتأثيرها على المستقبل، مشيرًا إلى أنها ستبدو كخيال علمي وتغير سوق العمل.
23-05-2025
منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى
دراسة جديدة تكشف عن تلاعب الشركات الكبرى في أداء نماذج الذكاء الاصطناعي عبر منصة LM Arena، مما يثير تساؤلات حول مصداقية التقييمات.
25-06-2025
تمكن Gemini AI الروبوتات الشبيهة بالبشر من الذكاء دون اتصال بالإنترنت
تقدم Google DeepMind نموذج Gemini Robotics On-Device، وهو نموذج ذكاء اصطناعي يمكّن الروبوتات الشبيهة بالبشر من العمل بشكل مستقل دون الحاجة إلى الإنترنت، مما يعزز الموثوقية والخصوصية.
ADVERTISEMENT
26-05-2025
تحول الذكاء الاصطناعي في قطاع الاتصالات: الرئيس التنفيذي الجديد لأوبتس يؤكد على أهمية البشر
ستيفن رو، الرئيس التنفيذي الجديد لأوبتس، يتحدث عن دور الذكاء الاصطناعي في تحسين قطاع الاتصالات مع التأكيد على أهمية البشر في العمليات.
22-05-2025
صاروخ الطاقة النووية من صن بيرد: ثورة في السفر إلى الفضاء
تسعى شركة صن بيرد إلى تطوير صاروخ يعمل بالطاقة النووية الاندماجية، مما يعد ثورة في مجال السفر إلى الفضاء. تعرف على الفوائد والتحديات التي تواجه هذا المشروع الطموح.
23-05-2025
تحليل أمان الذكاء الاصطناعي: تحويل بياناتك إلى دفاعات قوية
اكتشف كيف يمكن للذكاء الاصطناعي تعزيز أمان البيانات في المؤسسات من خلال تحسين سير العمل وزيادة الكفاءة.
ADVERTISEMENT
20-06-2025
الكشف عن الصور الأولى من مرصد روبين الذي يغير قواعد اللعبة
من المقرر أن يكشف مرصد فيرا سي. روبين عن صوره الأولى في 23 يونيو، مما يمثل حقبة جديدة في علم الفلك بقدراته المتقدمة ومسحه الطموح للسماء.
28-05-2025
مشروع قانون ترامب الكبير قد يمنع الولايات من تنظيم الذكاء الاصطناعي لعقد كامل
مشروع قانون ترامب الكبير قد يمنع الولايات من تنظيم الذكاء الاصطناعي لعقد كامل، مما يثير قلق المشرعين حول تأثير ذلك على الابتكار والتنظيم.
24-06-2025
روبوت بشري يحلق: تحقيق أول رحلة على الإطلاق
اكتشف كيف حقق روبوت بشري أول رحلة مستدامة له على الإطلاق، مما يمثل قفزة هائلة في الروبوتات ويفتح إمكانيات جديدة لتطبيقات الروبوتات المتنوعة.
ADVERTISEMENT
17-06-2025
ميتا وأوكلي يروجان لإطلاق النظارات الذكية في 20 يونيو
تستعد ميتا وأوكلي للكشف عن نظارات ذكية جديدة في 20 يونيو، بناءً على إرث ميتا من راي بان بتصاميم رياضية وميزات محسنة.
18-06-2025
جوجل تطلق نماذج Gemini 2.5 AI الجاهزة للإنتاج، مما يكثف التحدي لـ OpenAI
تطلق جوجل نماذج Gemini 2.5 AI الجاهزة للإنتاج، بما في ذلك Pro و Flash و Flash-Lite، لتحدي هيمنة OpenAI على الشركات من خلال تعزيز التفكير والعروض المتدرجة والتسعير القوي.
17-06-2025
وكالة ناسا توافق على مهمة خاصة لمحطة الفضاء الدولية بعد إصلاح تسرب الهواء
وكالة ناسا توافق على مهمة خاصة لمحطة الفضاء الدولية بعد إصلاحات ناجحة لتسرب الهواء في وحدة زفيزدا الروسية، مما يمهد الطريق لمهمة أكسيوم 4.
ADVERTISEMENT