منصة تقييم الذكاء الاصطناعي تحت المجهر: دراسة تكشف تلاعب الشركات الكبرى

التكنولوجيا اليومية

التكنولوجيا اليومية

·

23/05/2025

button icon
ADVERTISEMENT

تواجه منصة تقييم الذكاء الاصطناعي الشهيرة LM Arena انتقادات شديدة من قبل الباحثين الذين يدعون أن اختبارات المنصة تفضل نماذج الذكاء الاصطناعي الخاصة بالشركات الكبرى. هذه الادعاءات تثير تساؤلات حول كيفية اختبار نماذج الذكاء الاصطناعي بشكل عادل ومتسق.

النقاط الرئيسية

خلفية عن LM Arena

بدأت LM Arena كمشروع بحثي في عام 2023 من قبل باحثين في جامعة كاليفورنيا، بيركلي. سرعان ما أصبحت المنصة وجهة مفضلة للشركات الكبرى ونماذج الذكاء الاصطناعي المفتوحة لاختبار أدائها. المنصة تعتمد على تحليل ردود الفعل من المستخدمين بدلاً من المعايير الأكاديمية التقليدية، مما جعلها تجذب أكثر من مليون زائر شهريًا.

ADVERTISEMENT

نتائج الدراسة

في الدراسة التي نُشرت في 29 أبريل، أشار الباحثون إلى أن النماذج الرائدة من شركات مثل ميتا وأوبن إيه آي وجوجل حصلت على 19.2% و20.4% من البيانات على التوالي، بينما حصلت 83 نموذجًا مفتوحًا على 29.7% فقط.

ردود الفعل

لم تقدم LM Arena تعليقًا رسميًا على الدراسة، لكنها أكدت عبر وسائل التواصل الاجتماعي أنها تحاول دائمًا تلبية طلبات التقييم من جميع مقدمي النماذج. كما أشاروا إلى أن الاختلاف في عدد الاختبارات المقدمة لا يعني أن بعض مقدمي النماذج يتلقون معاملة غير عادلة.

ADVERTISEMENT

أهمية النتائج

تثير هذه النتائج تساؤلات حول مصداقية LM Arena كمعيار لتقييم الذكاء الاصطناعي. مع تزايد أهمية الذكاء الاصطناعي في مختلف المجالات، يصبح من الضروري تطوير طرق تقييم أكثر عدلاً وموضوعية.

في ظل هذه الظروف، يتعين على المجتمع العلمي والمطورين العمل معًا لضمان أن تكون اختبارات الذكاء الاصطناعي عادلة وموثوقة، مما يساهم في تحسين جودة النماذج وتقديم نتائج دقيقة للمستخدمين.

قراءة مقترحة

04-07-2025
تطبيق شونين جامب يرفع حد القراءة اليومي، ويقدم وصولاً غير محدود إلى المانجا
تطبيق شونين جامب يزيل حد الفصل اليومي، مما يسمح للمشتركين بقراءة مانغا غير محدودة. اكتشف كيف يعزز هذا التغيير تجربة القراءة للمسلسلات الشهيرة مثل ون بيس وناروتو.
ADVERTISEMENT
28-05-2025
كيف ستغير الذكاء الاصطناعي حياتنا وعملنا؟
مقابلة مع الخبيرة ميلاني سوبين حول تأثير الذكاء الاصطناعي على حياتنا وعملنا، وكيف يمكننا الاستعداد للتغييرات القادمة.
27-05-2025
جوجل تطور وضع الصوت فقط لتطبيقات الفيديو في أندرويد أوتو
جوجل تطور وضع الصوت فقط لتطبيقات الفيديو في أندرويد أوتو، مما يتيح للمستخدمين الاستمتاع بالمحتوى الصوتي أثناء القيادة.
23-06-2025
روبوتاكسي تسلا ينطلق في أوستن: رهان بتريليون دولار
تطلق تسلا خدمة سيارات الأجرة الروبوتية في أوستن، تكساس، مما يمثل خطوة مهمة في رؤية إيلون ماسك لمستقبل الشركة في الذكاء الاصطناعي والروبوتات، وسط منافسة شرسة.
ADVERTISEMENT
17-07-2025
انفجار شمسي هائل يشكل "وادي نار" بطول 250,000 ميل على الشمس
أدى ثوران شمسي هائل في 15 يوليو إلى نحت وادٍ من البلازما بطول 250 ألف ميل على سطح الشمس. ويؤكد العلماء أن الانبعاث الكتلي الإكليلي (CME) متجه بعيدًا عن الأرض.
03-07-2025
انغمس: فيلم "الفك المفترس" يعود إلى دور العرض بمناسبة الذكرى الخمسين مع أول إصدار بتقنية 4DX على الإطلاق
تحتفل Jaws بالذكرى الخمسين لتأسيسها بإعادة إصدار في 4DX و D-Box لأول مرة، مما يوفر تجربة سينمائية غامرة.
20-06-2025
نظارات Xreal One Pro الذكية: لمحة عن مستقبل الشاشات القابلة للارتداء في مؤتمر WWDC
يستعرض مراسل CNET نظارة Xreal One Pro الذكية في مؤتمر WWDC، مسلطًا الضوء على فائدتها كشاشة محمولة ووضع الشفافية التلقائية المبتكر، مما يعرض المشهد المتطور لتقنية النظارات الذكية.
ADVERTISEMENT
09-07-2025
سوني برافيا تلفزيونات LED: مستقبل الترفيه المنزلي في عام 2025
استكشف أفضل تلفزيونات سوني برافيا LED لعام 2025، التي تقدم جودة صورة فائقة وميزات ذكية وأحجام شاشات متنوعة لتجربة ترفيه منزلي مثالية.
26-05-2025
تأثير الذكاء الاصطناعي على فرص العمل للمبتدئين في جيل زد
تأثير الذكاء الاصطناعي على فرص العمل للمبتدئين في جيل زد، وكيف يمكن للشباب التكيف مع التغيرات في سوق العمل.
12-06-2025
جولي كيت تستعد: ترقيات عصا التحكم لـ Switch 2 قيد العمل بالفعل
تعمل GuliKit بالفعل على تطوير ترقيات لذراع التحكم لجهاز Nintendo Switch 2، لمعالجة مخاوف الانجراف المحتملة حيث من المتوقع أن يستخدم الجهاز الجديد تقنية ذراع التحكم المشابهة لسلفه.
ADVERTISEMENT
01-07-2025
أوبن إيه آي توقف العمليات لمدة أسبوع وسط نزيف المواهب إلى ميتا
أفادت التقارير أن OpenAI أغلقت أبوابها لمدة أسبوع، مما أجبر الموظفين على الراحة وسط نزوح المواهب إلى Meta، مما يسلط الضوء على التكلفة البشرية الباهظة لسباق التسلح في مجال الذكاء الاصطناعي.
15-07-2025
جروك يحصل على رفيق أنمي مع وضع "غير لائق للعمل"
يقدم روبوت الدردشة Grok AI الخاص بإيلون ماسك صورًا رمزية جديدة لـ "رفاق"، بما في ذلك شخصية أنمي مع وضع "غير لائق للبالغين" اختياري، وذلك بعد الخلافات الأخيرة.
09-06-2025
تكشف شركة فيجور روبوتيكس عن فيجور 02 وتلمح إلى فيجور 03
تكشف شركة فيجر روبوتيكس عن Figure 02 بشبكتها العصبية الحلزونية وتلمح إلى Figure 03 القادم، مما يعرض التطورات في الروبوتات الشبيهة بالبشر والذكاء الاصطناعي.
ADVERTISEMENT
27-05-2025
تكنولوجيا الذكاء الاصطناعي تقدم الأمل في قضايا الاتجار بالبشر
تكنولوجيا الذكاء الاصطناعي تقدم الأمل في قضايا الاتجار بالبشر، حيث تساعد في إنشاء صور رقمية للضحايا المفقودين وتسلط الضوء على جهود المجتمع لحمايتهم.
20-05-2025
من الأرض إلى المدار: كيف يدعم مركز التحكم في بعثات أكسيوم الفضاء الخاصة
تستعرض هذه المقالة دور مركز التحكم في بعثات أكسيوم الفضاء الخاصة وكيف يدعم البعثات إلى محطة الفضاء الدولية، مما يمهد الطريق لإنشاء محطة أكسيوم التجارية.
07-07-2025
روبوتات الصين تنطلق: سلسلة توريد محلية بنسبة 90% تقلل الاعتماد على رقائق الولايات المتحدة
تحقق الصين نسبة توطين تبلغ 90% في سلسلة توريد الروبوتات الشبيهة بالبشر، مما يقلل الاعتماد على الرقائق الأمريكية وسط تصاعد التوترات التجارية ومفاوضات العناصر الأرضية النادرة.
ADVERTISEMENT