منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

30-05-2025
GeForce Now على Steam Deck: ثورة في ألعاب AAA المحمولة
اكتشف كيف يُحدث تطبيق Nvidia GeForce Now ثورة في تجربة الألعاب على Steam Deck، مما يتيح لك لعب ألعاب AAA المتطلبة رسوميًا بسلاسة مع عمر بطارية أطول وأداء محسن.
ADVERTISEMENT
13-08-2025
روبوت ماجيك بوت الصيني يستعرض قوته، ويسحب 551 رطلاً بسهولة
اكتشف القوة المذهلة لروبوت MagicBot البشري الصيني وهو يسحب 551 رطلاً. تعرف على قدراته في الذكاء الاصطناعي وتطبيقاته الصناعية ومهاراته المتنوعة.
14-08-2025
سلسلة Galaxy S24 تحصل على أول تجربة لـ One UI 8.0 التجريبية مع أندرويد 16
سامسونج تطلق تحديث One UI 8.0 التجريبي لسلسلة Galaxy S24، جالبًا معه ميزات أندرويد 16، وتحسينات واجهة المستخدم، وأمانًا محسّنًا.
23-05-2025
الرؤساء التنفيذيون في مجال التكنولوجيا يستخدمون الذكاء الاصطناعي لاستبدال أنفسهم
تقرير عن استخدام الرؤساء التنفيذيين في مجال التكنولوجيا للذكاء الاصطناعي لاستبدال أنفسهم في مكالمات الأرباح، وتأثير ذلك على القوى العاملة.
ADVERTISEMENT
08-07-2025
حصل روبوت على شهادة في حفل تخرج المدرسة الثانوية في الصين
حصل روبوت شبيه بالبشر على شهادة في حفل تخرج من المدرسة الثانوية في فوجيان، الصين، مما يمثل لحظة فكاهية وهامة لدمج الذكاء الاصطناعي.
23-07-2025
الصين تكشف النقاب عن Walker S2: أول روبوت مستقل في العالم ببطاريات ذاتية التبديل
اكتشف Walker S2، أول روبوت مستقل في العالم من UBTech Robotics، قادر على التشغيل المستمر عن طريق التبديل الذاتي لبطارياته. تعرف على كيف أن هذا الابتكار سيحدث ثورة في الأتمتة الصناعية.
05-09-2025
جوجل ستحظر التحميل الجانبي لتطبيقات أندرويد غير الموثقة العام المقبل
تعتزم جوجل حظر التحميل الجانبي لتطبيقات أندرويد غير الموثوقة بدءًا من العام المقبل، مما يؤثر على توزيع التطبيقات وأمنها استجابةً لأحكام مكافحة الاحتكار.
ADVERTISEMENT
28-08-2025
منافس سامسونج لـ Vision Pro: هل السعر المرتفع لا يزال مبالغًا فيه؟
سماعة الواقع الممتد (XR) القادمة من سامسونج، مشروع موهان، يُشاع أنها ستكلف حوالي 1800 دولار، مما يثير تساؤلات حول جدواها في السوق على الرغم من كونها أرخص من سماعة آبل فيجن برو.
09-07-2025
تُزيح VITURE الستار عن تشكيلة نظارات ذكية رائدة
تُزيح VITURE الستار عن سلسلة Luma الجديدة ونظارات Beast الذكية، التي تتميز بلوحات Sony micro-OLED لتجربة بصرية تشبه دقة 4K وقدرات XR متقدمة.
13-08-2025
مراجعة Alienware 16 Area-51: تحفة لوحة مفاتيح ميكانيكية خذلتها شاشتها
يعود لاب توب Alienware Area-51 بلوحة مفاتيح ميكانيكية رائعة وأداء قوي، لكن شاشة مخيبة للآمال ومشاكل حرارية تفسد التجربة الفاخرة.
ADVERTISEMENT
15-07-2025
عودة والت ديزني: كشف النقاب عن شخصية متحركة سريالية بمناسبة الذكرى السبعين لديزني لاند
تحتفل ديزني لاند بالذكرى السبعين لتأسيسها بدمية والت ديزني المتحركة الجديدة والمتطورة للغاية، مما يوفر تجربة سريالية ومؤثرة للضيوف.
15-08-2025
كشف النقاب عن الأثر الصحي: العلماء يتصدون للكشف عن اللدائن الدقيقة في جسم الإنسان
اكتشف كيف يعمل العلماء لتحديد ما إذا كانت اللدائن الدقيقة الموجودة في جميع أنحاء جسم الإنسان تضر بصحتنا حقًا، والتحديات التي تنطوي عليها هذه الأبحاث الهامة.
29-05-2025
جوجل صور تحتفل بمرور 10 سنوات على إطلاقها مع أكثر من 9 تريليون صورة وفيديو
احتفلت جوجل صور بمرور 10 سنوات على إطلاقها، مع أكثر من 9 تريليون صورة وفيديو مخزنة، وقدمت ميزات جديدة مثل محرر الصور المعاد تصميمه وأكواد QR لمشاركة الألبومات.
ADVERTISEMENT
15-08-2025
اختراق في قراءة الأفكار: واجهة دماغية جديدة تفك شفرة المونولوجات الداخلية
طور باحثون من جامعة ستانفورد واجهة دماغية جديدة يمكنها تفسير الأحاديث الداخلية بدقة تصل إلى 74%، مما يبعث الأمل في تحسين التواصل لمن يعانون من صعوبات في النطق.
08-07-2025
نظرة خاطفة على مستقبل الهواتف الذكية ثلاثية الطي: Tecno Phantom Ultimate G Fold
يشاع أن هاتف Tecno Phantom Ultimate G Fold ثلاثي الطي القابل للطي سيطلق في منتصف يوليو، ويتميز بتصميم مبتكر قابل للطي للداخل. تعرف على ميزاته والتوقيت الاستراتيجي لإطلاقه في السوق.
12-06-2025
الملحمة التي استمرت عقودًا: الكشف عن بناء نجمة الموت
استكشف البناء المعقد الذي استمر لعقود لـ
ADVERTISEMENT