منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

09-07-2025
سلاح الثعابين السري: كشف غموض هضم العظام
اكتشف العلماء سلاحًا سريًا لدى الثعابين: خلايا متخصصة تسمح لها بهضم العظام بأكملها دون المعاناة من زيادة الكالسيوم. يسلط هذا الاكتشاف الضوء على آليات الهضم الفريدة لهذه الثعابين ويمكن أن يكون له آثار أوسع لفهم تنظيم المعادن في الحيوانات آكلة اللحوم الأخرى التي تتغذى على العظام.
ADVERTISEMENT
29-05-2025
استخدام الذكاء الاصطناعي لإنشاء "مراسلين" قضائيين واقعيين
اكتشف كيف يتم استخدام الذكاء الاصطناعي لإنشاء مراسلين قضائيين واقعيين، وما هي الفوائد والتحديات المرتبطة بهذه التكنولوجيا الجديدة.
18-06-2025
آيرنهارت: صياغة إرث جديد بمباركة توني ستارك
اكتشف كيف ستواصل 'قلب الحديد' إرث توني ستارك بموافقة روبرت داوني جونيور. تعرف على رحلة ريري ويليامز كمهندسة عبقرية في سلسلة ديزني+ الجديدة.
04-07-2025
ضائع في الفضاء: قمر صناعي "يغير قواعد اللعبة" لرصد الانبعاثات يختفي
قمر صناعي بقيمة 88 مليون دولار، MethaneSAT، مصمم لتتبع انبعاثات الميثان العالمية بدقة، توقف عن العمل بشكل غير متوقع بعد 15 شهرًا فقط في المدار. هذه الخسارة تمثل انتكاسة كبيرة لجهود مراقبة المناخ.
ADVERTISEMENT
22-05-2025
دراسة جديدة من آبل تعلم الروبوتات كيفية التصرف من خلال مشاهدة البشر
تستعرض دراسة جديدة من آبل كيفية تدريب الروبوتات على التصرف من خلال مشاهدة البشر، باستخدام تقنيات متقدمة لجمع البيانات وتحسين الأداء.
03-06-2025
لا تنظروا إلى الشرق الأوسط كـ "فوز سريع": نصيحة لشركات التكنولوجيا الزراعية الناشئة
اكتشف لماذا يجب على الشركات الناشئة في مجال التكنولوجيا الزراعية التركيز على خلق قيمة طويلة الأجل والتعاون في الشرق الأوسط، بدلاً من البحث عن "فوز سريع"، وفقًا لـ Silal Innovation Oasis.
20-05-2025
Certis تطلق الروبوتات البشرية في خطوة نحو المستقبل
Certis تطلق أول روبوت بشري في سنغافورة، مستكشفة كيف يمكن للروبوتات تعزيز العمليات الأمنية وإدارة المرافق.
ADVERTISEMENT
29-05-2025
تطبيق T-Mobile الجديد: هل هو أداة لتحسين الخدمة أم انتهاك للخصوصية؟
تطبيق T-Mobile الجديد يثير قلق العملاء حول الخصوصية بعد تفعيل أداة تسجيل الشاشة بشكل افتراضي. تعرف على التفاصيل وكيفية إيقاف تشغيل الأداة.
13-06-2025
أنكر تستدعي أكثر من مليون بنك طاقة باور كور 10000 وسط مخاوف من اندلاع حريق
استدعت Anker أكثر من 1.1 مليون بنك طاقة PowerCore 10000 بسبب مخاطر الحريق والانفجار. تعرف على كيفية التحقق مما إذا كان جهازك متأثرًا وخطوات الاستبدال.
03-07-2025
مفارقة مايكروسوفت: تسريح آلاف الموظفين وسط مليارات الأرباح
مايكروسوفت تسرح آلاف الموظفين على الرغم من الأرباح القياسية، مما يثير مخاوف بشأن تأثير الذكاء الاصطناعي على مستقبل العمل في صناعة التكنولوجيا.
ADVERTISEMENT
26-05-2025
نظارات ذكية مدعومة بالذكاء الاصطناعي: هل يمكنها تقليل أخطاء الأدوية؟
تسعى الأبحاث في جامعة واشنطن إلى استخدام الذكاء الاصطناعي في تطوير نظارات ذكية تساعد في تقليل الأخطاء الطبية المتعلقة بالأدوية وتحسين سلامة المرضى.
26-06-2025
الذكاء الاصطناعي يحيي فيلم 'ساحر أوز' في ذا سفير، مما يثير جدلاً حول الحفاظ على الأفلام
يأتي فيلم ساحر أوز إلى ذا سفير في لاس فيغاس، باستخدام الذكاء الاصطناعي لتكييف الفيلم الكلاسيكي مع المكان الغامر. تثير هذه الخطوة جدلاً حول الحفاظ على الأفلام والتحسين التكنولوجي.
30-05-2025
Hermès تطلق سماعات رأس فاخرة بسعر 15,000 دولار
تطلق Hermès سماعات رأس فاخرة بسعر 15,000 دولار، تتميز بجلد البقر المخيط يدويًا وتصميم أنيق. اكتشف المزيد عن هذه التحفة الصوتية.
ADVERTISEMENT
22-05-2025
اختيار 20 شركة فضاء جديدة من قبل المفوضية الأوروبية لتسريع الأعمال
اختيار 20 شركة فضاء جديدة من قبل المفوضية الأوروبية لتسريع الأعمال، ضمن برنامج CASSINI لدعم الابتكار والنمو في قطاع الفضاء.
04-06-2025
حل لغز سماوي عمره 600 عام: تحديد "النجم الضيف" الغامض على أنه مستعر أعظم
تمكن علماء الفلك أخيرًا من حل لغز عمره 600 عام حول 'النجم الضيف' الذي ظهر عام 1408 في عهد أسرة مينغ الصينية، حيث حددوا أنه كان مستعرًا بناءً على وثيقة تاريخية اكتشفت حديثًا.
11-06-2025
مقابلة WWDC: المديرون التنفيذيون في Apple يكشفون عن تأخير Siri ومستقبل Apple Intelligence
يناقش المديران التنفيذيان في شركة Apple، كريج فيديريغي وجريج جوسوياك، تأخر Siri، ونهج Apple الفريد في الذكاء الاصطناعي، ومستقبل Apple Intelligence، مع التركيز على الميزات المتكاملة بدلاً من روبوتات الدردشة المستقلة.
ADVERTISEMENT