منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

13-08-2025
سامسونج جالكسي S25 FE من المقرر إطلاقه في سبتمبر: شريحة إكسينوس، وميزات الذكاء الاصطناعي، وتصميم مطور متوقع
يشاع أن هاتف Samsung Galaxy S25 FE سيُطلق في سبتمبر مع شريحة Exynos 2400e وتصميم محسّن وشاشة AMOLED بتردد 120 هرتز وبطارية بسعة 4900 مللي أمبير في الساعة.
ADVERTISEMENT
03-07-2025
واجهة كبسولة H2L: تحكم في الروبوتات الشبيهة بالبشر من كرسي مريح
اكتشف واجهة الكبسولة المبتكرة من H2L، والتي تتيح للمستخدمين التحكم في الروبوتات الشبيهة بالبشر بحركات العضلات من كرسي، مما يحدث ثورة في العمل عن بعد والرعاية الصحية والمزيد.
11-09-2025
جوجل توقف ميزة Daily Hub للذكاء الاصطناعي في بيكسل 10 بعد أسابيع من إطلاقها
قامت جوجل بإزالة ميزة Daily Hub AI من هواتف بيكسل 10 بعد وقت قصير من إطلاقها، مشيرةً إلى تحسينات في الأداء والتخصيص.
14-08-2025
هايسنس تبهر بتلفزيون ميني-إل إي دي قياس 100 بوصة، بسعر 20,000 دولار
تكشف هاينسنس عن تلفزيونها 100UX بدقة 4K بحجم 100 بوصة بتقنية Mini-LED، والذي يقدم سطوعًا ذرويًا يبلغ 5000 شمعة (نيتس) بسعر 19,999 دولارًا. استكشف ميزاته وسوق أجهزة التلفزيون ذات الشاشات الكبيرة المتنامي.
ADVERTISEMENT
23-05-2025
ثورة الأجهزة الذكية: شراكة بين خبير تصميم آيفون ورئيس OpenAI
السير جوني آيف ورئيس OpenAI، سام ألتمان، يعلنان عن شراكة جديدة تهدف إلى إحداث ثورة في عالم الأجهزة الذكية من خلال تطوير جهاز ذكي مبتكر.
19-08-2025
سامسونج تكشف عن Galaxy Buds 3 FE: ميزات فاخرة بسعر 150 دولارًا
تطلق سامسونج سماعات Galaxy Buds 3 FE الاقتصادية بسعر 150 دولارًا، وتقدم ميزات الذكاء الاصطناعي وإلغاء الضوضاء بسعر أقل من سماعات Buds 3 Pro الرائدة.
15-09-2025
سامسونج جالكسي بادز 3 FE: صوت جيد، ولكن هل هي كافية؟
مراجعة لسماعات Samsung Galaxy Buds 3 FE، تسلط الضوء على جودة الصوت الرائعة ولكنها تشير إلى تنازلات في إلغاء الضوضاء النشط (ANC) والميزات مقابل سعرها البالغ 150 دولارًا.
ADVERTISEMENT
14-08-2025
صائدو أشباح أنتاركتيكا: داخل أكبر كاشف نيوترينو في العالم
استكشف آيس كيوب، أكبر كاشف نيوترينو في العالم في القارة القطبية الجنوبية، وأبحاثه الرائدة في الجسيمات دون الذرية المراوغة والظواهر الكونية.
10-07-2025
الفنانة الروبوتية Ai-Da ذات المليون دولار: "لا تهدف إلى استبدال الفنانين البشريين"
الفنانة الروبوتية الشبيهة بالبشر Ai-Da، المعروفة ببيع أعمال فنية بأكثر من مليون دولار، تصرح بأنها لا تهدف إلى استبدال الفنانين البشريين، بل لإثارة مناقشات حول الاستخدام الأخلاقي للذكاء الاصطناعي في الفن.
05-09-2025
فيليبس هيو ترتقي بالمنازل الذكية بإضاءة أكثر ذكاءً وجرس باب أكثر وضوحاً
قامَت Philips Hue بتحديث منتجاتها المنزلية الذكية مع مصابيح بأسعار معقولة، وجسر Bridge Pro قوي، ودعم لتقنيتي Thread وMatter، وجرس باب بدقة 2K، مما يجعل المنازل أكثر ذكاءً وأمانًا.
ADVERTISEMENT
26-08-2025
Galaxea AI: شركة روبوتات صينية ناشئة بقيمة 700 مليون دولار تستهدف تسلا
اكتشف كيف تهدف شركة Galaxea AI الصينية الناشئة، بروبوتاتها البشرية R1 وتمويلها الكبير، إلى التنافس مع عمالقة التكنولوجيا مثل تسلا في سوق الروبوتات العالمي سريع التوسع.
21-07-2025
جونو يكشف عن موجة بلازما جديدة فوق القطب الشمالي للمشتري
اكتشف مسبار جونو التابع لناسا نوعًا جديدًا من موجات البلازما فوق القطب الشمالي لكوكب المشتري، مما يقدم رؤى حول الغلاف الجوي للكوكب والمغناطيسية الكوكبية الخارجية.
22-08-2025
يتطور وضع الذكاء الاصطناعي من جوجل بميزات وكيلة للحجوزات والمزيد
وضع الذكاء الاصطناعي من جوجل يحصل على ميزات وكيلة قوية جديدة لحجوزات المطاعم والرحلات الجوية والمزيد، ويتوسع ليشمل 180 دولة. اكتشف توصيات مخصصة وأدوات تعاون.
ADVERTISEMENT
23-07-2025
رقصة كونية: نبتون وجسم بعيد يرقصان بتزامن مداري نادر
اكتشف علماء الفلك الجسم 2020 VN40، وهو جسم بعيد في رنين مداري نادر بنسبة 10:1 مع نبتون، مما يقدم رؤى جديدة حول تطور النظام الشمسي الخارجي.
18-07-2025
هاتفك الأندرويد: نظام إنذار مبكر بالزلازل غير متوقع
اكتشف كيف تُحدث هواتف Android تحولًا في أنظمة الإنذار المبكر بالزلازل، مما يوفر ثوانٍ حاسمة من الإشعار قبل اهتزاز الأرض، كما هو مفصل في دراسة جديدة.
22-07-2025
روبوت تجريبي يتمرد في حادث تحطيم انتشر بسرعة
يُظهر مقطع فيديو انتشر على نطاق واسع روبوتًا بشريًا تجريبيًا يرتجف بشكل لا يمكن السيطرة عليه، مما تسبب في انهيار رافعة. تعزو الشركة العطل إلى خطأ بشري.
ADVERTISEMENT