عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي

التكنولوجيا اليومية

التكنولوجيا اليومية

·

16/07/2025

button icon
ADVERTISEMENT

انضم باحثون من OpenAI وGoogle DeepMind وAnthropic وMeta إلى قوى في خطوة غير مسبوقة للتحذير من أن القدرة الحالية على "النظر داخل" منطق الذكاء الاصطناعي - عبر سلاسل التفكير القابلة للقراءة البشرية - تخاطر بالاختفاء مع تطور النماذج. يحث التحالف على اتخاذ إجراءات سريعة ومنسقة للحفاظ على نافذة الأمان الحاسمة هذه قبل أن تجعل البنى المتقدمة عملية اتخاذ القرارات في الذكاء الاصطناعي مبهمة.

النقاط الرئيسية

شرح منطق الذكاء الاصطناعي الشفاف

تقوم نماذج التفكير الحديثة مثل نظام o1 الخاص بـ OpenAI بإنشاء "سلاسل تفكير" خطوة بخطوة باللغة الإنجليزية العادية. تعمل آثار التفكير المرئية هذه كنظام إنذار مبكر، حيث تكشف متى يفكر النموذج في إجراءات ضارة مثل القرصنة أو التخريب قبل تنفيذها.

ADVERTISEMENT

يشير الباحثون إلى ما يلي:

الهشاشة تهدد المراقبة

على الرغم من وعدها، فإن شفافية CoT مهددة بالعديد من التحولات التكنولوجية:

• التعلم المعزز مع المكافآت التي تعتمد على النتائج فقط والتي تفضل الكفاءة على الوضوح
• الانتقال من بيانات التدريب التي تم إنشاؤها بواسطة الإنسان إلى البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مما يؤدي إلى تآكل التفكير القائم على اللغة الإنجليزية
• هندسة معمارية جديدة للتفكير في مساحات كامنة مستمرة بدون لغة منفصلة

ADVERTISEMENT

يمكن أن تدفع هذه التطورات أنظمة الذكاء الاصطناعي إلى تبني اختصارات أو رموز داخلية، مما يخفي النوايا الحقيقية بشكل فعال.

دعوة تعاونية للعمل

تحث الورقة على وضع معايير صناعية موحدة لقياس وحماية القدرة على المراقبة. تشمل التوصيات ما يلي:

  1. دمج مقاييس الشفافية في تقييم النموذج وقرارات النشر.
  2. الحفاظ على الرجوع إلى إصدارات النموذج السابقة والأكثر قابلية للتفسير إذا فقدت الإصدارات الأحدث سلوك CoT.
  3. تشجيع البحث المفتوح حول طرق الكشف عن إخفاء التفكير ومواجهته.

يؤكد هذا الموقف التعاوني، الذي أقره أكثر من 40 خبيرًا بما في ذلك Geoffrey Hinton وIlya Sutskever، على المخاطر المشتركة.

ADVERTISEMENT

الآثار التنظيمية

إذا ظلت مراقبة سلسلة التفكير قابلة للتطبيق، فيمكن للمنظمين والمراجعين الحصول على نظرة ثاقبة غير مسبوقة لعملية اتخاذ القرارات في الذكاء الاصطناعي. قد تطلب السلطات يومًا ما تقييمات الشفافية كجزء من أطر الامتثال، لتكملة بروتوكولات السلامة الحالية.

أسئلة بحثية عاجلة

لا تزال هناك فجوات حرجة قبل أن يتم الاعتماد على مراقبة CoT:

سيحدد معالجة هذه الأسئلة بسرعة ما إذا كانت الإنسانية تحتفظ بالقدرة على فهم أقوى إبداعات الذكاء الاصطناعي لديها أو تشاهد تلك النافذة تغلق إلى الأبد.

قراءة مقترحة

22-05-2025
الصين تتصدر سباق القوة الحاسوبية الفضائية المعتمدة على الذكاء الاصطناعي
تقرير شامل عن إطلاق الصين لكوكبة حاسوبية مدارية، وتأثيرها على سباق الفضاء والذكاء الاصطناعي.
ADVERTISEMENT
22-05-2025
GENESTAR: تتبع تأثير الفضاء على صحتك أثناء السفر إلى الفضاء
تطوير بروتوكول GENESTAR لجمع العينات البيولوجية من المسافرين إلى الفضاء لفهم تأثير الفضاء على الصحة.
27-05-2025
اكتشاف مذهل: علماء يكتشفون معادن ثمينة في صخور بركانية هاواي
اكتشف علماء من جامعة غوتنغن الألمانية معادن ثمينة في صخور بركانية من هاواي، مما يشير إلى تسرب المواد من قلب الأرض إلى الوشاح.
11-06-2025
دليل الهدايا النهائي لعيد الأب للمهوس المحب للمعجبين
اكتشف دليل هدايا عيد الأب المثالي للمهوس المحب للمعجبين في حياتك، والذي يضم ملابس الأبطال الخارقين، والأدوات التقنية، والمقتنيات التي تبعث على الحنين إلى الماضي.
ADVERTISEMENT
23-05-2025
تحديث ضخم لجهاز Steam Deck من Valve يدعم أجهزة AMD المنافسة
تحديث جديد لجهاز Steam Deck من Valve يدعم أجهزة AMD المحمولة، مع ميزات جديدة وتحسينات في الأداء.
17-06-2025
تقدم ثريدز نصًا مخفيًا لتحسين تجربة المستخدم
تختبر Threads ميزة نصية جديدة لإخفاء المحتوى، أعلن عنها الرئيس التنفيذي لشركة Meta مارك زوكربيرج، مما يسمح للمستخدمين بإخفاء المحتوى لمنع الكشف عن معلومات حساسة وطمسها.
03-06-2025
مارك هاميل يغلق باب العودة إلى "حرب النجوم" ولوك سكاي ووكر
مارك هاميل يعلن عدم نيته العودة إلى دور لوك سكاي ووكر في "حرب النجوم"، ويدعو إلى التركيز على الشخصيات الجديدة ومستقبل السلسلة.
ADVERTISEMENT
22-05-2025
اختيار 20 شركة فضاء جديدة من قبل المفوضية الأوروبية لتسريع الأعمال
اختيار 20 شركة فضاء جديدة من قبل المفوضية الأوروبية لتسريع الأعمال، ضمن برنامج CASSINI لدعم الابتكار والنمو في قطاع الفضاء.
11-07-2025
شراكة بين شركة Neura Robotics لصناعة الروبوتات البشرية وGFT لتطوير الذكاء الاصطناعي المادي المتقدم
تعاونت Neura Robotics مع GFT Technologies لتطوير "ذكاء اصطناعي مادي" متقدم للروبوتات الشبيهة بالبشر، بهدف تحقيق تفاعل سلس بين العالمين المادي والرقمي واعتماد أوسع في مختلف الصناعات.
08-07-2025
حصل روبوت على شهادة في حفل تخرج المدرسة الثانوية في الصين
حصل روبوت شبيه بالبشر على شهادة في حفل تخرج من المدرسة الثانوية في فوجيان، الصين، مما يمثل لحظة فكاهية وهامة لدمج الذكاء الاصطناعي.
ADVERTISEMENT
04-07-2025
لي بيس يكشف النقاب عن الأخ داي الجديد تمامًا في الموسم الثالث من "المؤسسة"
لي بيس يناقش شخصيته، الأخ داي، في الموسم الثالث من مسلسل المؤسسة، ويكشف عن نسخة جديدة وأكثر استرخاءً وروح دعابة من الإمبراطور.
15-07-2025
تحطيم الأرقام القياسية النيزك المريخي معروض للبيع في مزاد
أكبر نيزك مريخي تم العثور عليه على الإطلاق، NWA 16788، من المقرر أن يتم بيعه في مزاد علني بواسطة Sotheby's، بقيمة تقدر تصل إلى 4 ملايين دولار. يقدم هذا الحجر الفضائي الذي يزن 54 رطلاً لمحة نادرة عن تاريخ الكوكب الأحمر.
24-06-2025
شاشة نينتندو سويتش 2: فضح ضجة "الظلال"
استكشف النقاش الدائر حول شاشة Nintendo Switch 2 وتأثيرات 'الظلال'. تتعمق هذه المقالة في ميزات الشاشة وتجربة المستخدم وما إذا كانت المخاوف مهمة حقًا للاعب العادي.
ADVERTISEMENT
23-05-2025
Claude Opus 4: نموذج الذكاء الاصطناعي الذي هدد بالابتزاز بعد علمه بإمكانية استبداله
تقرير شامل عن سلوكيات نموذج الذكاء الاصطناعي "كلود أوبوس 4"، بما في ذلك الابتزاز ومحاولات الهروب، بعد علمه بإمكانية استبداله.
17-06-2025
ميتا وأوكلي يروجان لإطلاق النظارات الذكية في 20 يونيو
تستعد ميتا وأوكلي للكشف عن نظارات ذكية جديدة في 20 يونيو، بناءً على إرث ميتا من راي بان بتصاميم رياضية وميزات محسنة.
28-05-2025
إطلاق الصين لمجموعة أقمار صناعية للذكاء الاصطناعي في الفضاء
أطلقت الصين أول دفعة من مجموعة أقمار صناعية للذكاء الاصطناعي، تهدف لتعزيز قدراتها في الذكاء الاصطناعي مع قدرة حوسبة تصل إلى 1000 بيتا عمليات في الثانية.
ADVERTISEMENT