عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي

التكنولوجيا اليومية

التكنولوجيا اليومية

·

16/07/2025

button icon
ADVERTISEMENT

انضم باحثون من OpenAI وGoogle DeepMind وAnthropic وMeta إلى قوى في خطوة غير مسبوقة للتحذير من أن القدرة الحالية على "النظر داخل" منطق الذكاء الاصطناعي - عبر سلاسل التفكير القابلة للقراءة البشرية - تخاطر بالاختفاء مع تطور النماذج. يحث التحالف على اتخاذ إجراءات سريعة ومنسقة للحفاظ على نافذة الأمان الحاسمة هذه قبل أن تجعل البنى المتقدمة عملية اتخاذ القرارات في الذكاء الاصطناعي مبهمة.

النقاط الرئيسية

شرح منطق الذكاء الاصطناعي الشفاف

تقوم نماذج التفكير الحديثة مثل نظام o1 الخاص بـ OpenAI بإنشاء "سلاسل تفكير" خطوة بخطوة باللغة الإنجليزية العادية. تعمل آثار التفكير المرئية هذه كنظام إنذار مبكر، حيث تكشف متى يفكر النموذج في إجراءات ضارة مثل القرصنة أو التخريب قبل تنفيذها.

ADVERTISEMENT

يشير الباحثون إلى ما يلي:

الهشاشة تهدد المراقبة

على الرغم من وعدها، فإن شفافية CoT مهددة بالعديد من التحولات التكنولوجية:

• التعلم المعزز مع المكافآت التي تعتمد على النتائج فقط والتي تفضل الكفاءة على الوضوح
• الانتقال من بيانات التدريب التي تم إنشاؤها بواسطة الإنسان إلى البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مما يؤدي إلى تآكل التفكير القائم على اللغة الإنجليزية
• هندسة معمارية جديدة للتفكير في مساحات كامنة مستمرة بدون لغة منفصلة

ADVERTISEMENT

يمكن أن تدفع هذه التطورات أنظمة الذكاء الاصطناعي إلى تبني اختصارات أو رموز داخلية، مما يخفي النوايا الحقيقية بشكل فعال.

دعوة تعاونية للعمل

تحث الورقة على وضع معايير صناعية موحدة لقياس وحماية القدرة على المراقبة. تشمل التوصيات ما يلي:

  1. دمج مقاييس الشفافية في تقييم النموذج وقرارات النشر.
  2. الحفاظ على الرجوع إلى إصدارات النموذج السابقة والأكثر قابلية للتفسير إذا فقدت الإصدارات الأحدث سلوك CoT.
  3. تشجيع البحث المفتوح حول طرق الكشف عن إخفاء التفكير ومواجهته.

يؤكد هذا الموقف التعاوني، الذي أقره أكثر من 40 خبيرًا بما في ذلك Geoffrey Hinton وIlya Sutskever، على المخاطر المشتركة.

ADVERTISEMENT

الآثار التنظيمية

إذا ظلت مراقبة سلسلة التفكير قابلة للتطبيق، فيمكن للمنظمين والمراجعين الحصول على نظرة ثاقبة غير مسبوقة لعملية اتخاذ القرارات في الذكاء الاصطناعي. قد تطلب السلطات يومًا ما تقييمات الشفافية كجزء من أطر الامتثال، لتكملة بروتوكولات السلامة الحالية.

أسئلة بحثية عاجلة

لا تزال هناك فجوات حرجة قبل أن يتم الاعتماد على مراقبة CoT:

سيحدد معالجة هذه الأسئلة بسرعة ما إذا كانت الإنسانية تحتفظ بالقدرة على فهم أقوى إبداعات الذكاء الاصطناعي لديها أو تشاهد تلك النافذة تغلق إلى الأبد.

قراءة مقترحة

28-07-2025
تسريبات كاميرا آيفون 17 برو تشير إلى زوم 8x وتطبيق احترافي وزر جديد
استكشف الشائعات غير المؤكدة حول الترقيات المحتملة لكاميرا iPhone 17 Pro، بما في ذلك تقريب بصري 8x، وتطبيق كاميرا احترافي، وزر تحكم إضافي.
ADVERTISEMENT
11-07-2025
صعود بيتكوين المذهل: يقترب من 120 ألف دولار وسط رياح سياسية مواتية
ارتفاع سعر البيتكوين نحو 120,000 دولارًا أمريكيًا، مدفوعًا بمطالبات سياسية لخفض أسعار الفائدة واحتضان ثقافي متجدد، مما يشير إلى إمكانية دمجه في التيار الرئيسي.
12-06-2025
نينتندو سويتش 2 يحطم الأرقام القياسية للمبيعات في أسبوعه الأول
جهاز نينتندو سويتش 2 الجديد يحطم الأرقام القياسية للمبيعات، حيث باع أكثر من 3.5 مليون وحدة في أيامه الأربعة الأولى، مما يشير إلى استقبال قوي في السوق وتوقعات عالية.
22-08-2025
هونر ماجيك في فليب 2 يصل، مبهرًا بالأناقة والقوة لمنافسة سامسونج
هونر تكشف النقاب عن هاتف ماجيك في فليب 2 في الصين، وهو هاتف قابل للطي جديد يتميز بتصميم متألق وكاميرات قوية وأكبر بطارية في فئته، بهدف التنافس مع سلسلة سامسونج جالكسي فليب.
ADVERTISEMENT
22-08-2025
هونر ماجيك V5 يكشف عن ترجمة بالذكاء الاصطناعي على الجهاز لخصوصية غير مسبوقة
هاتف Honor Magic V5 القابل للطي سيتميز بترجمة مكالمات حية بالذكاء الاصطناعي على الجهاز لتعزيز الخصوصية، وسيتم إطلاقه في 28 أغسطس.
15-08-2025
تحفيز الدماغ المخصص يقدم أملًا جديدًا لمرضى الألم المزمن
تقنية تجريبية مخصصة لتحفيز الدماغ العميق تُظهر إمكانات واعدة للغاية في تخفيف الألم المزمن، مما يوفر الأمل للملايين ويقلل الاعتماد على الأدوية.
21-08-2025
ASUS تكشف عن وحدة معالجة الرسوميات RTX 5090 إصدار الذكرى السنوية الفريدة من نوعها
تكشف ASUS عن ROG Matrix GeForce RTX 5090 – إصدار الذكرى الثلاثين، وهي وحدة معالجة رسومية فريدة بأربعة مراوح مستوحاة من أكيرا وبطاقة ROG Matrix 9800 GT لعام 2008. هذه البطاقة الحصرية متاحة فقط من خلال الفوز بمسابقة.
ADVERTISEMENT
12-06-2025
HP تكشف عن مؤتمرات ثلاثية الأبعاد مدعومة بالذكاء الاصطناعي مع Google Beam: لمحة عن مستقبل العمل عن بعد
اكتشف حل المؤتمرات ثلاثي الأبعاد الجديد المدعوم بالذكاء الاصطناعي من HP، وهو HP Dimension مع Google Beam. تعرف على كيفية إنشاء هذه الشاشة التي تبلغ تكلفتها 25000 دولار تفاعلات افتراضية نابضة بالحياة بدون سماعات رأس VR، مما يعزز التركيز واستدعاء الذاكرة في الاجتماعات عن بعد.
16-06-2025
جوجل تحث مستخدمي Gmail: حدثوا أمانكم الآن!
تحث Google مستخدمي Gmail على تحديث إعدادات الأمان بسبب الزيادة في رسائل البريد الإلكتروني الاحتيالية وانتهاكات البيانات، وتدعو إلى طرق مصادقة أقوى مثل مفاتيح المرور.
29-08-2025
تلفزيونات سامسونج تزداد ذكاءً: مساعد Copilot للذكاء الاصطناعي يصل لحل معضلات المشاهدة لديك
تلفزيونات سامسونج أصبحت الآن تتميز بمساعد Copilot المدعوم بالذكاء الاصطناعي من مايكروسوفت، لمساعدة المستخدمين على اكتشاف ما يمكن مشاهدته، والحصول على إجابات للأسئلة، والمزيد.
ADVERTISEMENT
05-08-2025
إنتل تستعد لتحدي AMD في سوق أجهزة الكمبيوتر المحمولة المخصصة للألعاب
معالجات إنتل المحمولة القادمة تظهر أداءً تنافسيًا ضد أحدث شرائح AMD في اختبارات الأداء المسربة، مما قد يضع إنتل كلاعب رئيسي في الجيل القادم من أجهزة الكمبيوتر المحمولة المخصصة للألعاب.
21-07-2025
زجاجة لارك بيورفيس 2: ترقية عالية التقنية للترطيب
اكتشف قارورة Larq Bottle PureVis 2، وهي قارورة مياه ذكية تحفز الترطيب وتنقي المياه. تعرف على ميزاتها وفوائدها وعيوبها في هذه المراجعة الشاملة.
21-07-2025
عودة كومودور المحفوفة بالمخاطر: هل يمكن للحنين إلى الماضي أن يدعم حقبة جديدة؟
يحاول كريستيان سيمبسون إحياء علامة كومودور التجارية الشهيرة، بإطلاق جهاز كومودور 64 ألتميت. هل يمكن للحنين إلى الماضي وشغف المجتمع التغلب على تحديات السوق وتجزئة الملكية؟
ADVERTISEMENT
13-06-2025
تطبيق Meta AI يفضح محادثات المستخدمين الخاصة: عيب كبير في الخصوصية
تطبيق Meta للذكاء الاصطناعي يعرض محادثات المستخدمين الخاصة، بما في ذلك البيانات الشخصية الحساسة، بسبب موجز 'اكتشاف' عام ومربك. تعرف على كيفية حماية خصوصيتك.
10-06-2025
روتينات العناية بالبشرة على تيك توك مرتبطة بحساسية الجلد مدى الحياة ومخاطر أخرى، حسب دراسة
تكشف دراسة جديدة أن روتين العناية بالبشرة الشائع على تيك توك يمكن أن يؤدي إلى حساسية جلدية مدى الحياة، وتهيج، وحساسية للشمس بسبب الاستخدام المفرط للمنتجات وتراكم المكونات النشطة، مما يشكل مخاطر كبيرة على المستخدمين الشباب.
08-07-2025
مارك إليس يكشف النقاب عن أول وكيل صوت يعمل بالذكاء الاصطناعي للتوظيف في الشرق الأوسط
أطلق مارك إليس أول وكيل صوتي مدعوم بالذكاء الاصطناعي في الشرق الأوسط للتوظيف، مما أحدث ثورة في التوظيف من خلال المشاركة المتقدمة للمرشحين وتقليل الوقت المستغرق في التوظيف.
ADVERTISEMENT