عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي

التكنولوجيا اليومية

التكنولوجيا اليومية

·

16/07/2025

button icon
ADVERTISEMENT

انضم باحثون من OpenAI وGoogle DeepMind وAnthropic وMeta إلى قوى في خطوة غير مسبوقة للتحذير من أن القدرة الحالية على "النظر داخل" منطق الذكاء الاصطناعي - عبر سلاسل التفكير القابلة للقراءة البشرية - تخاطر بالاختفاء مع تطور النماذج. يحث التحالف على اتخاذ إجراءات سريعة ومنسقة للحفاظ على نافذة الأمان الحاسمة هذه قبل أن تجعل البنى المتقدمة عملية اتخاذ القرارات في الذكاء الاصطناعي مبهمة.

النقاط الرئيسية

شرح منطق الذكاء الاصطناعي الشفاف

تقوم نماذج التفكير الحديثة مثل نظام o1 الخاص بـ OpenAI بإنشاء "سلاسل تفكير" خطوة بخطوة باللغة الإنجليزية العادية. تعمل آثار التفكير المرئية هذه كنظام إنذار مبكر، حيث تكشف متى يفكر النموذج في إجراءات ضارة مثل القرصنة أو التخريب قبل تنفيذها.

ADVERTISEMENT

يشير الباحثون إلى ما يلي:

الهشاشة تهدد المراقبة

على الرغم من وعدها، فإن شفافية CoT مهددة بالعديد من التحولات التكنولوجية:

• التعلم المعزز مع المكافآت التي تعتمد على النتائج فقط والتي تفضل الكفاءة على الوضوح
• الانتقال من بيانات التدريب التي تم إنشاؤها بواسطة الإنسان إلى البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مما يؤدي إلى تآكل التفكير القائم على اللغة الإنجليزية
• هندسة معمارية جديدة للتفكير في مساحات كامنة مستمرة بدون لغة منفصلة

ADVERTISEMENT

يمكن أن تدفع هذه التطورات أنظمة الذكاء الاصطناعي إلى تبني اختصارات أو رموز داخلية، مما يخفي النوايا الحقيقية بشكل فعال.

دعوة تعاونية للعمل

تحث الورقة على وضع معايير صناعية موحدة لقياس وحماية القدرة على المراقبة. تشمل التوصيات ما يلي:

  1. دمج مقاييس الشفافية في تقييم النموذج وقرارات النشر.
  2. الحفاظ على الرجوع إلى إصدارات النموذج السابقة والأكثر قابلية للتفسير إذا فقدت الإصدارات الأحدث سلوك CoT.
  3. تشجيع البحث المفتوح حول طرق الكشف عن إخفاء التفكير ومواجهته.

يؤكد هذا الموقف التعاوني، الذي أقره أكثر من 40 خبيرًا بما في ذلك Geoffrey Hinton وIlya Sutskever، على المخاطر المشتركة.

ADVERTISEMENT

الآثار التنظيمية

إذا ظلت مراقبة سلسلة التفكير قابلة للتطبيق، فيمكن للمنظمين والمراجعين الحصول على نظرة ثاقبة غير مسبوقة لعملية اتخاذ القرارات في الذكاء الاصطناعي. قد تطلب السلطات يومًا ما تقييمات الشفافية كجزء من أطر الامتثال، لتكملة بروتوكولات السلامة الحالية.

أسئلة بحثية عاجلة

لا تزال هناك فجوات حرجة قبل أن يتم الاعتماد على مراقبة CoT:

سيحدد معالجة هذه الأسئلة بسرعة ما إذا كانت الإنسانية تحتفظ بالقدرة على فهم أقوى إبداعات الذكاء الاصطناعي لديها أو تشاهد تلك النافذة تغلق إلى الأبد.

قراءة مقترحة

13-11-2025
موسيقى الذكاء الاصطناعي تطمس الحدود، تاركة المستمعين في حالة من القلق والارتباك
استكشف القلق المتزايد والارتباك المحيط بالموسيقى التي تم إنشاؤها بواسطة الذكاء الاصطناعي، حيث يكشف استطلاع جديد أن معظم الناس لا يستطيعون التمييز بين المقطوعات البشرية والاصطناعية.
ADVERTISEMENT
20-08-2025
CNET تستضيف حفل مشاهدة مباشر لحدث بيكسل من جوجل
انضم إلى حفلة مشاهدة CNET المباشرة لحدث Google Pixel. احصل على تحليل في الوقت الفعلي ورؤى الخبراء حول الكشف عن الهواتف الجديدة بدءًا من الغد الساعة 12:30 ظهرًا بتوقيت شرق الولايات المتحدة.
27-11-2025
مقارنة تأثير طفرة الذكاء الاصطناعي على أسعار ذاكرة الوصول العشوائي مقابل أسعار أقراص الحالة الصلبة
وسط طفرة الذكاء الاصطناعي، ارتفعت أسعار ذاكرة الوصول العشوائي (RAM) بشكل أسرع بكثير من أقراص الحالة الثابتة (SSDs)، مما أثر على بناة أجهزة الكمبيوتر بزيادات متقلبة في التكاليف مرتبطة بالعرض ومراكز البيانات ذات الطلب المرتفع.
09-01-2026
أسوس تكشف عن أول جهاز توجيه Wi-Fi 8 في معرض CES 2026، واعدة باتصال الجيل القادم
تكشف Asus عن أول جهاز توجيه Wi-Fi 8 لها، وهو ROG NeoCore، في معرض CES 2026، مما يشير إلى حقبة جديدة من الاتصال اللاسلكي الذي يركز على الموثوقية وتكامل الذكاء الاصطناعي.
ADVERTISEMENT
09-09-2025
الشعوذة: الطقوس الأخيرة يحطم أرقام قياسية للسلسلة بأداء مبهر في شباك التذاكر
اكتشف كيف حقق فيلم "الشعوذة: الطقوس الأخيرة" إيرادات بلغت 187 مليون دولار عالميًا، وهو الأفضل في تاريخ السلسلة، ليصبح نجاحًا كبيرًا في شباك التذاكر على الرغم من المراجعات المتباينة.
18-06-2025
مايكروسوفت تلمح إلى أجهزة إكس بوكس من الجيل التالي: تأكيد تجارب غرفة المعيشة والأجهزة المحمولة بالشراكة مع AMD
تعلن مايكروسوفت عن شراكة استراتيجية مع AMD لتطوير أجهزة Xbox للجيل القادم، بما في ذلك أجهزة لغرفة المعيشة وأجهزة الألعاب المحمولة، واعدة بقفزات تكنولوجية كبيرة وتوافق رجعي.
23-10-2025
تطبيق Tinder يطرح تسجيل الدخول الإلزامي بالتعرف على الوجه على مستوى البلاد
يفرض Tinder تسجيل الدخول بالتعرف على الوجه على مستوى البلاد لمستخدمي الولايات المتحدة، مما يعزز الأمان ضد الملفات الشخصية المزيفة والمواعدة الوهمية. تعرف على كيفية عمل ميزة Face Check الجديدة وتداعياتها على الخصوصية.
ADVERTISEMENT
21-10-2025
سامسونج Exynos 2600 ستشغل جميع طرازات Galaxy S26، مع أداء ذكاء اصطناعي فائق
تم تأكيد معالج Exynos 2600 من سامسونج لجميع طرازات Galaxy S26، متفوقًا على شرائح Apple و Qualcomm في أداء الذكاء الاصطناعي والرسومات.
11-06-2025
فك شفرة الواقع: كيف يرى روبوت أطلس من بوسطن ديناميكس العالم
اكتشف كيف يدرك روبوت أطلس البشري من بوسطن ديناميكس بيئته ويتفاعل معها من خلال دمج المستشعرات المتقدم ورسم الخرائط في الوقت الفعلي.
24-11-2025
الظهور الكبير للروبوت الروسي بالذكاء الاصطناعي ينتهي بسقوط محرج
تم تشويه الظهور الأول لروبوت بشري روسي جديد يعمل بالذكاء الاصطناعي بسقوط محرج بعد وقت قصير من ظهوره على المسرح، مما يسلط الضوء على التحديات في تطوير الروبوتات الحالية.
ADVERTISEMENT