منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

·

23/05/2025

ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

تفضيل النماذج الخاصة: الدراسة تشير إلى أن LM Arena تمنح نماذج الذكاء الاصطناعي الخاصة مزايا غير معلنة.
تحليل البيانات: الباحثون قاموا بتحليل أكثر من 2.8 مليون معركة على مدى خمسة أشهر.
توزيع غير عادل للبيانات: الشركات الكبرى مثل جوجل وأوبن إيه آي حصلت على نسبة كبيرة من البيانات مقارنة بالنماذج المفتوحة.
تأثير الاختبارات المتكررة: النماذج الخاصة يتم اختبارها عدة مرات قبل الإطلاق، مما يمنحها ميزة تنافسية.

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

اختبارات متعددة: النماذج الخاصة يتم اختبارها عدة مرات قبل إصدارها، مما يمنحها فرصة لتحسين أدائها.
تراجع النتائج: يمكن للشركات الكبرى سحب نتائجها من التقييمات، مما يؤثر على تصنيفها في القائمة العامة.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

بكتيريا آكلة للحوم تصيب سباحًا في شاطئ فالموث

أصيب سباح في فالماوث، ماساتشوستس، ببكتيريا آكلة للحوم، وهي بكتيريا الضمة اللاهوائية (Vibrio vulnificus)، بعد السباحة في شاطئ أولد سيلفر. تعرف على المخاطر والوقاية.

ADVERTISEMENT

الحدود الجديدة لألعاب الماك: المحاكاة من طرف ثالث مقابل الدعم الأصلي

تعمق في كيفية قيام محاكاة الطرف الثالث لمعمارية x86 مثل Fex بإحداث ثورة في ألعاب Mac، مع مقارنة إمكاناتها مقابل استراتيجية الدعم الأصلي لشركة Apple.

شائعات حول هاتف آيفون القابل للطي من آبل: ميزات تعدد مهام شبيهة بالآيباد ومستشعر بصمات الأصابع جانبي

استكشف أحدث الشائعات حول هاتف آبل القابل للطي، بما في ذلك ميزات تعدد المهام الشبيهة بالآيباد، ومستشعر بصمات الأصابع المثبت على الجانب، والسعر المحتمل البالغ 2000 دولار.

ثقوب سوداء بدائية متفجرة قد تعيد كتابة تاريخ الكون

اكتشف كيف أن الثقوب السوداء البدائية المتفجرة، وفقًا لنموذج نظري جديد، قد تصبح قابلة للرصد قريبًا، مما يتيح فرصة لإعادة كتابة تاريخ الكون.

ADVERTISEMENT

شعلة بلازما الهيدروجين تقضي على النفايات البلاستيكية في أجزاء من الثانية

اكتشف كيف تفكك شعلة بلازما جديدة تعمل بالهيدروجين من KIMM النفايات البلاستيكية في أجزاء من الثانية، وتحولها إلى مواد خام قيّمة بأقل تأثير بيئي.

الاتجاهات التكنولوجية الرئيسية: صعود شاشات NXTPAPER الصديقة للعين من TCL

استكشف أحدث ترقيات TCL NXTPAPER واكتشف الاتجاهات الرئيسية في الشاشات الصديقة للعين، والشاشات متعددة الأوضاع، وإنتاجية الذكاء الاصطناعي في الهواتف الذكية والأجهزة اللوحية.

روبوت يسرق الأضواء في موكب رأس السنة الصينية في باريس

أصبح روبوت شبيه بالبشر نجمًا غير متوقع في موكب رأس السنة الصينية في باريس، مما يدل على التكامل المتزايد للتكنولوجيا المتقدمة في الاحتفالات الثقافية وسط طفرة عالمية في تطوير الروبوتات.

ADVERTISEMENT

جوجل تقدم ميزة "اتصل بصديق" لاستعادة الحساب

تتيح ميزة "جهات اتصال الاسترداد" الجديدة من جوجل للمستخدمين تعيين أصدقاء موثوق بهم لمساعدتهم في استعادة حساباتهم. تعرف على هذه الميزة وغيرها من إجراءات الأمان الجديدة من جوجل.

ريزر تكشف عن مشروع موتوكو: سماعة رأس للألعاب تعمل بالذكاء الاصطناعي في معرض الإلكترونيات الاستهلاكية 2026

تكشف Razer عن Project Motoko، وهو مفهوم مبتكر لسماعات الألعاب مدعومة بالذكاء الاصطناعي في معرض الإلكترونيات الاستهلاكية 2026، ويتميز بقدرات ذكية مثل التعرف على الأشياء في الوقت الفعلي وترجمة اللغات.

ترامب يجلب الذكاء الاصطناعي إلى الشرق الأوسط بدلاً من الديمقراطية

تقرير عن زيارة ترامب للشرق الأوسط التي تركز على التكنولوجيا بدلاً من الديمقراطية، مع التركيز على صفقة الرقائق المتقدمة والمنافسة مع الصين.

ADVERTISEMENT