عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي

التكنولوجيا اليومية

التكنولوجيا اليومية

·

16/07/2025

button icon
ADVERTISEMENT

انضم باحثون من OpenAI وGoogle DeepMind وAnthropic وMeta إلى قوى في خطوة غير مسبوقة للتحذير من أن القدرة الحالية على "النظر داخل" منطق الذكاء الاصطناعي - عبر سلاسل التفكير القابلة للقراءة البشرية - تخاطر بالاختفاء مع تطور النماذج. يحث التحالف على اتخاذ إجراءات سريعة ومنسقة للحفاظ على نافذة الأمان الحاسمة هذه قبل أن تجعل البنى المتقدمة عملية اتخاذ القرارات في الذكاء الاصطناعي مبهمة.

النقاط الرئيسية

شرح منطق الذكاء الاصطناعي الشفاف

تقوم نماذج التفكير الحديثة مثل نظام o1 الخاص بـ OpenAI بإنشاء "سلاسل تفكير" خطوة بخطوة باللغة الإنجليزية العادية. تعمل آثار التفكير المرئية هذه كنظام إنذار مبكر، حيث تكشف متى يفكر النموذج في إجراءات ضارة مثل القرصنة أو التخريب قبل تنفيذها.

ADVERTISEMENT

يشير الباحثون إلى ما يلي:

الهشاشة تهدد المراقبة

على الرغم من وعدها، فإن شفافية CoT مهددة بالعديد من التحولات التكنولوجية:

• التعلم المعزز مع المكافآت التي تعتمد على النتائج فقط والتي تفضل الكفاءة على الوضوح
• الانتقال من بيانات التدريب التي تم إنشاؤها بواسطة الإنسان إلى البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مما يؤدي إلى تآكل التفكير القائم على اللغة الإنجليزية
• هندسة معمارية جديدة للتفكير في مساحات كامنة مستمرة بدون لغة منفصلة

ADVERTISEMENT

يمكن أن تدفع هذه التطورات أنظمة الذكاء الاصطناعي إلى تبني اختصارات أو رموز داخلية، مما يخفي النوايا الحقيقية بشكل فعال.

دعوة تعاونية للعمل

تحث الورقة على وضع معايير صناعية موحدة لقياس وحماية القدرة على المراقبة. تشمل التوصيات ما يلي:

  1. دمج مقاييس الشفافية في تقييم النموذج وقرارات النشر.
  2. الحفاظ على الرجوع إلى إصدارات النموذج السابقة والأكثر قابلية للتفسير إذا فقدت الإصدارات الأحدث سلوك CoT.
  3. تشجيع البحث المفتوح حول طرق الكشف عن إخفاء التفكير ومواجهته.

يؤكد هذا الموقف التعاوني، الذي أقره أكثر من 40 خبيرًا بما في ذلك Geoffrey Hinton وIlya Sutskever، على المخاطر المشتركة.

ADVERTISEMENT

الآثار التنظيمية

إذا ظلت مراقبة سلسلة التفكير قابلة للتطبيق، فيمكن للمنظمين والمراجعين الحصول على نظرة ثاقبة غير مسبوقة لعملية اتخاذ القرارات في الذكاء الاصطناعي. قد تطلب السلطات يومًا ما تقييمات الشفافية كجزء من أطر الامتثال، لتكملة بروتوكولات السلامة الحالية.

أسئلة بحثية عاجلة

لا تزال هناك فجوات حرجة قبل أن يتم الاعتماد على مراقبة CoT:

سيحدد معالجة هذه الأسئلة بسرعة ما إذا كانت الإنسانية تحتفظ بالقدرة على فهم أقوى إبداعات الذكاء الاصطناعي لديها أو تشاهد تلك النافذة تغلق إلى الأبد.

قراءة مقترحة

06-10-2025
فايرفلاي من أدوبي يحوّل صورك إلى فيديوهات جذابة: ثورة في الإبداع الحركي
تقدم أدوبي Firefly، أداة مدعومة بالذكاء الاصطناعي تقوم بإنشاء مقاطع فيديو من الصور أو التعليمات النصية. اكتشف كيف يغيّر Firefly عملية إنشاء المحتوى الرقمي بسهولة ومرونة.
ADVERTISEMENT
25-06-2025
NVIDIA تكشف عن GeForce RTX 5050 الموفر للطاقة
توسع NVIDIA تشكيلة وحدات معالجة الرسوميات الخاصة بها مع بطاقة GeForce RTX 5050 الجديدة، وهي بطاقة رسوميات موفرة للطاقة مصممة لكل من أجهزة الكمبيوتر المحمولة والمكتبية، مما يجلب ميزات RTX المتقدمة إلى جمهور أوسع.
22-08-2025
هونر ماجيك V5 يكشف عن ترجمة بالذكاء الاصطناعي على الجهاز لخصوصية غير مسبوقة
هاتف Honor Magic V5 القابل للطي سيتميز بترجمة مكالمات حية بالذكاء الاصطناعي على الجهاز لتعزيز الخصوصية، وسيتم إطلاقه في 28 أغسطس.
08-10-2025
تخزين فائق السرعة: UFS 5.0 يستعد لإحداث ثورة في أداء الهواتف الذكية
تعد وحدة التخزين UFS 5.0 بمضاعفة سرعات الهواتف الذكية وزيادة الكفاءة، مما يمهد الطريق لميزات الذكاء الاصطناعي الأسرع وتجارب أكثر سلاسة في الهواتف المستقبلية.
ADVERTISEMENT
21-07-2025
تنبيه عاجل: ثغرة SharePoint جديدة CVE-2025-53770 قيد الاستغلال النشط
أصدرت Microsoft إرشادات عاجلة بشأن CVE-2025-53770، وهي ثغرة أمنية جديدة في SharePoint لتنفيذ التعليمات البرمجية عن بُعد قيد الاستغلال النشط، مما يتيح الوصول غير المصادق عليه والتحكم الكامل في المحتوى.
08-09-2025
Philips Hue تكشف عن خيارات إضاءة ذكية بأسعار معقولة
تقدم فيليبس هيو مصابيح ذكية بأسعار معقولة وتوسع نظامها البيئي للمنزل الذكي بجسر جديد وجرس باب فيديو. اكتشف أحدث ما في الإضاءة الذكية وأخبار التكنولوجيا الأخرى.
28-05-2025
فضيحة الذكاء الاصطناعي في المحاكم: مكتب محاماة آخر يتعرض للانتقادات بسبب أخطاء ChatGPT
فضيحة جديدة في الساحة القانونية الأمريكية تتعلق باستخدام الذكاء الاصطناعي، حيث اعتذر مكتب محاماة عن تقديم استشهادات قانونية خاطئة بسبب ChatGPT.
ADVERTISEMENT
28-07-2025
أسوس تكشف عن مواصفات طاقة وحدات معالجة الرسوميات المحمولة من سلسلة RTX 50
تكشف أسوس عن المواصفات الكاملة لـ TGP لأجهزة لابتوب الألعاب ROG و TUF لعام 2025 المزودة بوحدات معالجة الرسوميات من سلسلة Nvidia RTX 50، مما يوفر شفافية غير مسبوقة للمستهلكين.
22-09-2025
لجنة السلامة التابعة لناسا تثير مخاوف بشأن مركبة الهبوط القمرية ستارلاينر، مما قد يؤخر مهمة أرتميس 3
لجنة السلامة التابعة لناسا تحذر من أن مركبة الهبوط القمرية "ستارشيب" التابعة لـ سبيس إكس قد تتأخر لسنوات، مما قد يؤثر على تاريخ مهمة أرتميس 3 المستهدف في عام 2027 بسبب التحديات التقنية والأولويات المتنافسة.
27-08-2025
مستخدمو صور جوجل على iOS يحصلون على ميزة ملصقات جديدة وممتعة، بينما ينتظر مستخدمو أندرويد
صور Google تطرح ميزة جديدة لإنشاء الملصقات لمستخدمي iOS، مما يتيح لهم استخراج العناصر بسهولة من الصور. تعرف على المزيد حول هذه الأداة الجديدة ومدى توفرها حاليًا.
ADVERTISEMENT