منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

23-05-2025
تحليل أمان الذكاء الاصطناعي: تحويل بياناتك إلى دفاعات قوية
اكتشف كيف يمكن للذكاء الاصطناعي تعزيز أمان البيانات في المؤسسات من خلال تحسين سير العمل وزيادة الكفاءة.
ADVERTISEMENT
26-05-2025
فضلات البطاريق قد تساعد في مكافحة تغير المناخ
دراسة جديدة تكشف كيف يمكن لفضلات البطاريق أن تساهم في مكافحة تغير المناخ من خلال زيادة تركيز الأمونيا وتكوين السحب في القارة القطبية الجنوبية.
22-05-2025
الصين تتصدر سباق القوة الحاسوبية الفضائية المعتمدة على الذكاء الاصطناعي
تقرير شامل عن إطلاق الصين لكوكبة حاسوبية مدارية، وتأثيرها على سباق الفضاء والذكاء الاصطناعي.
19-06-2025
فيلم فرانسيس فورد كوبولا 'ميجالوبوليس' يعود إلى دور العرض في حدث فريد من نوعه
يعود فيلم
ADVERTISEMENT
20-06-2025
تطبيق Gemini يطلق ميزة تحميل وتحليل الفيديو عبر جميع المنصات
اكتشف كيف يتيح تطبيق Gemini من Google الآن تحميل مقاطع الفيديو وتحليلها على Android و iPhone والويب، مما يعزز قدرات الذكاء الاصطناعي متعدد الوسائط لجميع المستخدمين.
18-06-2025
إطلاق هوندا الصاروخي: حقبة جديدة لعملاق السيارات في الفضاء
دخلت هوندا، الشركة اليابانية المصنعة للسيارات، بشكل غير متوقع سباق الفضاء بإطلاق وهبوط ناجح لنموذج أولي لصاروخ قابل لإعادة الاستخدام، بهدف الطيران دون المداري بحلول عام 2029.
26-05-2025
تحول الذكاء الاصطناعي في قطاع الاتصالات: الرئيس التنفيذي الجديد لأوبتس يؤكد على أهمية البشر
ستيفن رو، الرئيس التنفيذي الجديد لأوبتس، يتحدث عن دور الذكاء الاصطناعي في تحسين قطاع الاتصالات مع التأكيد على أهمية البشر في العمليات.
ADVERTISEMENT
21-05-2025
جوجل تبدأ في دمج روبوت الدردشة الذكي في محرك البحث
جوجل تعلن عن دمج روبوت الدردشة الذكي في محرك البحث، مما يتيح تجربة محادثة أكثر تعقيدًا للمستخدمين، مع خطط لتطوير نظارات ذكية جديدة.
29-05-2025
جيم كرامر: الذكاء الاصطناعي قد يكون "القوة الأكثر أهمية" في مستقبل الوظائف
جيم كرامر يتحدث عن تأثير الذكاء الاصطناعي على سوق العمل، محذرًا من زيادة البطالة وفقدان الوظائف، بينما يشير إلى الفوائد المحتملة لهذه التكنولوجيا.
28-05-2025
فضيحة الذكاء الاصطناعي في المحاكم: مكتب محاماة آخر يتعرض للانتقادات بسبب أخطاء ChatGPT
فضيحة جديدة في الساحة القانونية الأمريكية تتعلق باستخدام الذكاء الاصطناعي، حيث اعتذر مكتب محاماة عن تقديم استشهادات قانونية خاطئة بسبب ChatGPT.
ADVERTISEMENT
28-05-2025
تسلا تواجه أزمة حادة في أوروبا مع تراجع المبيعات
تسلا تواجه أزمة حادة في مبيعاتها في أوروبا، حيث انخفضت بنسبة 49% في أبريل 2025، مما يثير تساؤلات حول استراتيجيات الشركة في ظل المنافسة المتزايدة.
30-05-2025
شنغهاي تستضيف مسابقة مهارات الروبوتات البشرية الدولية لعام 2025
تغطية شاملة لمسابقة مهارات الروبوتات البشرية الدولية لعام 2025 في شنغهاي، الصين، مع التركيز على التحديات والابتكارات التكنولوجية.
12-06-2025
فيلم 'ديب كوفر' من برايم فيديو يقلب سيناريو الدراما الجريمة البريطانية بطريقة مضحكة
اكتشف 'Deep Cover'، الكوميديا ​​الحركية الجديدة من Prime Video التي تقلب السيناريو بشكل مضحك في دراما الجريمة البريطانية، بطولة برايس دالاس هوارد، أورلاندو بلوم، ونيك محمد.
ADVERTISEMENT
20-06-2025
الروبوت الرائد: الروبوت البشري الصيني يصبح أول مرشد للمشي لمسافات طويلة في جبل تاي
روبوت بشري صيني يصنع التاريخ كأول روبوت من نوعه يرشد المتنزهين في جبل تاي، مما يشير إلى حقبة جديدة للسياحة والروبوتات.
18-06-2025
جوجل تطلق نماذج Gemini 2.5 AI الجاهزة للإنتاج، مما يكثف التحدي لـ OpenAI
تطلق جوجل نماذج Gemini 2.5 AI الجاهزة للإنتاج، بما في ذلك Pro و Flash و Flash-Lite، لتحدي هيمنة OpenAI على الشركات من خلال تعزيز التفكير والعروض المتدرجة والتسعير القوي.
27-05-2025
بروتين مصمم بالذكاء الاصطناعي يحاكي الحركة الطبيعية
اكتشف كيف تمكن علماء من UCSF من تصميم بروتينات صناعية قادرة على الحركة باستخدام تقنيات الذكاء الاصطناعي، مما يفتح آفاقًا جديدة في الطب والبيئة.
ADVERTISEMENT