عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي

التكنولوجيا اليومية

التكنولوجيا اليومية

·

16/07/2025

button icon
ADVERTISEMENT

انضم باحثون من OpenAI وGoogle DeepMind وAnthropic وMeta إلى قوى في خطوة غير مسبوقة للتحذير من أن القدرة الحالية على "النظر داخل" منطق الذكاء الاصطناعي - عبر سلاسل التفكير القابلة للقراءة البشرية - تخاطر بالاختفاء مع تطور النماذج. يحث التحالف على اتخاذ إجراءات سريعة ومنسقة للحفاظ على نافذة الأمان الحاسمة هذه قبل أن تجعل البنى المتقدمة عملية اتخاذ القرارات في الذكاء الاصطناعي مبهمة.

النقاط الرئيسية

شرح منطق الذكاء الاصطناعي الشفاف

تقوم نماذج التفكير الحديثة مثل نظام o1 الخاص بـ OpenAI بإنشاء "سلاسل تفكير" خطوة بخطوة باللغة الإنجليزية العادية. تعمل آثار التفكير المرئية هذه كنظام إنذار مبكر، حيث تكشف متى يفكر النموذج في إجراءات ضارة مثل القرصنة أو التخريب قبل تنفيذها.

ADVERTISEMENT

يشير الباحثون إلى ما يلي:

الهشاشة تهدد المراقبة

على الرغم من وعدها، فإن شفافية CoT مهددة بالعديد من التحولات التكنولوجية:

• التعلم المعزز مع المكافآت التي تعتمد على النتائج فقط والتي تفضل الكفاءة على الوضوح
• الانتقال من بيانات التدريب التي تم إنشاؤها بواسطة الإنسان إلى البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مما يؤدي إلى تآكل التفكير القائم على اللغة الإنجليزية
• هندسة معمارية جديدة للتفكير في مساحات كامنة مستمرة بدون لغة منفصلة

ADVERTISEMENT

يمكن أن تدفع هذه التطورات أنظمة الذكاء الاصطناعي إلى تبني اختصارات أو رموز داخلية، مما يخفي النوايا الحقيقية بشكل فعال.

دعوة تعاونية للعمل

تحث الورقة على وضع معايير صناعية موحدة لقياس وحماية القدرة على المراقبة. تشمل التوصيات ما يلي:

  1. دمج مقاييس الشفافية في تقييم النموذج وقرارات النشر.
  2. الحفاظ على الرجوع إلى إصدارات النموذج السابقة والأكثر قابلية للتفسير إذا فقدت الإصدارات الأحدث سلوك CoT.
  3. تشجيع البحث المفتوح حول طرق الكشف عن إخفاء التفكير ومواجهته.

يؤكد هذا الموقف التعاوني، الذي أقره أكثر من 40 خبيرًا بما في ذلك Geoffrey Hinton وIlya Sutskever، على المخاطر المشتركة.

ADVERTISEMENT

الآثار التنظيمية

إذا ظلت مراقبة سلسلة التفكير قابلة للتطبيق، فيمكن للمنظمين والمراجعين الحصول على نظرة ثاقبة غير مسبوقة لعملية اتخاذ القرارات في الذكاء الاصطناعي. قد تطلب السلطات يومًا ما تقييمات الشفافية كجزء من أطر الامتثال، لتكملة بروتوكولات السلامة الحالية.

أسئلة بحثية عاجلة

لا تزال هناك فجوات حرجة قبل أن يتم الاعتماد على مراقبة CoT:

سيحدد معالجة هذه الأسئلة بسرعة ما إذا كانت الإنسانية تحتفظ بالقدرة على فهم أقوى إبداعات الذكاء الاصطناعي لديها أو تشاهد تلك النافذة تغلق إلى الأبد.

قراءة مقترحة

29-09-2025
تقنية XPAN من كوالكوم تعد باتصال سلس لسماعات الأذن اللاسلكية يتجاوز نطاق البلوتوث
تهدف تقنية XPAN الجديدة من كوالكوم إلى حل قيود نطاق البلوتوث لسماعات الأذن اللاسلكية من خلال تمكين التبديل السلس إلى شبكة Wi-Fi، واعدة بصوت غير منقطع ومستقبل من تجارب الاستماع المستقلة.
ADVERTISEMENT
22-08-2025
سبيس إكس تطلق الطائرة الفضائية X-37B التابعة لقوة الفضاء في مهمة اختبار عسكرية جديدة
شاهد البث المباشر لإطلاق سبيس إكس للطائرة الفضائية X-37B التابعة لقوة الفضاء الأمريكية في مهمتها التجريبية العسكرية الثامنة، حاملةً تقنيات متقدمة للاتصالات بالليزر والملاحة الكمومية.
16-09-2025
أسلاك ITER فائقة التوصيل تجتاز اختبار الحرارة الحاسم لطاقة الاندماج
اكتشف كيف اجتاز أكثر من 5,500 سلك فائق التوصيل لمفاعل الاندماج ITER بنجاح اختبارات الحرارة والضغط الشديدة، مما يمثل تقدمًا كبيرًا في أبحاث طاقة الاندماج.
05-09-2025
يصل iOS 26 و iPadOS 26 بيتا العامة 5 قبل الإطلاق الرسمي
أبل تطلق النسخة التجريبية العامة الخامسة لنظامي iOS 26 و iPadOS 26، مع توقع الإطلاق النهائي الشهر المقبل. تعرف على كيفية الانضمام إلى برنامج النسخة التجريبية وماذا تتوقع.
ADVERTISEMENT
08-09-2025
تسريبات آيفون 17 تلمح إلى فيديو بدقة 8K، وطراز "إير" جديد قبيل الإطلاق
تسريبات لمواصفات تشكيلة آيفون 17 تكشف عن إمكانية تسجيل فيديو بدقة 8K لطرازات Pro وإدخال نسخة "آيفون 17 إير"، وذلك قبل الإعلان الرسمي من آبل.
07-08-2025
تأجيل إطلاق الطائرة الفضائية دريم تشيسر مرة أخرى، وهدف 2025 غير مرجح
من غير المرجح إطلاق مركبة الفضاء دريم تشيسر في عام 2025 بسبب التحديات التقنية وتحديات الاعتماد المستمرة، بما في ذلك جاهزية البرمجيات ومركبة الإطلاق.
14-08-2025
الإمارات وفنلندا تُبرمان تحالفًا علميًا في الأرصاد الجوية والأبحاث القطبية
توقع الإمارات وفنلندا مذكرة تفاهم لتعزيز التعاون في مجال الأرصاد الجوية وأبحاث القطبين، مع التركيز على تبادل الخبرات وخدمات طقس الفضاء والذكاء الاصطناعي للتنبؤات.
ADVERTISEMENT
05-08-2025
شات جي بي تي لحث المستخدمين على أخذ فترات راحة وسط مخاوف الإدمان والصحة العقلية
تقدم OpenAI تذكيرات بأخذ فترات راحة في ChatGPT لمكافحة الاستخدام الإدماني، لكن الخبراء يشككون في فعاليتها لأولئك الذين يعانون من سلوكيات قهرية خطيرة. كما تسلط هذه الخطوة الضوء على المخاوف المستمرة بشأن تأثير الذكاء الاصطناعي على الصحة العقلية وخصوصية المستخدم.
19-08-2025
مُقرض العملات المشفرة فيجر يتقدم بطلب طرح عام أولي وسط جهل عام واسع النطاق
تتقدم شركة فيجر للحلول التقنية، مقرضة البلوكتشين، بطلب للاكتتاب العام الأولي وسط الفهم المحدود للجمهور للعملات المشفرة، مسلطة الضوء على التطبيقات العملية والاندماج في التيار السائد.
27-05-2025
راي كيرزويل يتحدى إيلون ماسك: صفقة بقيمة 100 مليون دولار لشركته "بيوند إيميجينيشن"
راي كيرزويل يعلن عن صفقة بقيمة 100 مليون دولار لشركته "بيوند إيميجينيشن"، في وقت تتسابق فيه تسلا وإنفيديا وميتا نحو تطوير الروبوتات المدعومة بالذكاء الاصطناعي.
ADVERTISEMENT