عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي

التكنولوجيا اليومية

التكنولوجيا اليومية

·

16/07/2025

button icon
ADVERTISEMENT

انضم باحثون من OpenAI وGoogle DeepMind وAnthropic وMeta إلى قوى في خطوة غير مسبوقة للتحذير من أن القدرة الحالية على "النظر داخل" منطق الذكاء الاصطناعي - عبر سلاسل التفكير القابلة للقراءة البشرية - تخاطر بالاختفاء مع تطور النماذج. يحث التحالف على اتخاذ إجراءات سريعة ومنسقة للحفاظ على نافذة الأمان الحاسمة هذه قبل أن تجعل البنى المتقدمة عملية اتخاذ القرارات في الذكاء الاصطناعي مبهمة.

النقاط الرئيسية

شرح منطق الذكاء الاصطناعي الشفاف

تقوم نماذج التفكير الحديثة مثل نظام o1 الخاص بـ OpenAI بإنشاء "سلاسل تفكير" خطوة بخطوة باللغة الإنجليزية العادية. تعمل آثار التفكير المرئية هذه كنظام إنذار مبكر، حيث تكشف متى يفكر النموذج في إجراءات ضارة مثل القرصنة أو التخريب قبل تنفيذها.

ADVERTISEMENT

يشير الباحثون إلى ما يلي:

الهشاشة تهدد المراقبة

على الرغم من وعدها، فإن شفافية CoT مهددة بالعديد من التحولات التكنولوجية:

• التعلم المعزز مع المكافآت التي تعتمد على النتائج فقط والتي تفضل الكفاءة على الوضوح
• الانتقال من بيانات التدريب التي تم إنشاؤها بواسطة الإنسان إلى البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مما يؤدي إلى تآكل التفكير القائم على اللغة الإنجليزية
• هندسة معمارية جديدة للتفكير في مساحات كامنة مستمرة بدون لغة منفصلة

ADVERTISEMENT

يمكن أن تدفع هذه التطورات أنظمة الذكاء الاصطناعي إلى تبني اختصارات أو رموز داخلية، مما يخفي النوايا الحقيقية بشكل فعال.

دعوة تعاونية للعمل

تحث الورقة على وضع معايير صناعية موحدة لقياس وحماية القدرة على المراقبة. تشمل التوصيات ما يلي:

  1. دمج مقاييس الشفافية في تقييم النموذج وقرارات النشر.
  2. الحفاظ على الرجوع إلى إصدارات النموذج السابقة والأكثر قابلية للتفسير إذا فقدت الإصدارات الأحدث سلوك CoT.
  3. تشجيع البحث المفتوح حول طرق الكشف عن إخفاء التفكير ومواجهته.

يؤكد هذا الموقف التعاوني، الذي أقره أكثر من 40 خبيرًا بما في ذلك Geoffrey Hinton وIlya Sutskever، على المخاطر المشتركة.

ADVERTISEMENT

الآثار التنظيمية

إذا ظلت مراقبة سلسلة التفكير قابلة للتطبيق، فيمكن للمنظمين والمراجعين الحصول على نظرة ثاقبة غير مسبوقة لعملية اتخاذ القرارات في الذكاء الاصطناعي. قد تطلب السلطات يومًا ما تقييمات الشفافية كجزء من أطر الامتثال، لتكملة بروتوكولات السلامة الحالية.

أسئلة بحثية عاجلة

لا تزال هناك فجوات حرجة قبل أن يتم الاعتماد على مراقبة CoT:

سيحدد معالجة هذه الأسئلة بسرعة ما إذا كانت الإنسانية تحتفظ بالقدرة على فهم أقوى إبداعات الذكاء الاصطناعي لديها أو تشاهد تلك النافذة تغلق إلى الأبد.

قراءة مقترحة

11-08-2025
iOS 26: الكشف عن ثلاث ميزات خفية
اكتشف ثلاثة ميزات خفية في iOS 26: وضع الطاقة التكيفي لتحسين عمر البطارية، جواز سفر أمريكي رقمي في Apple Wallet، وبث الفيديو عبر AirPlay لـ CarPlay.
ADVERTISEMENT
08-07-2025
الشرق الأوسط على وشك تولي زمام القيادة الاقتصادية وسط التحولات العالمية
الشرق الأوسط على وشك أن يصبح قوة اقتصادية عالمية، مستفيدًا من مزاياه الفريدة في مجال الطاقة المتجددة، والالتزامات المناخية، والبنية التحتية للذكاء الاصطناعي، وفقًا لتقرير جديد صادر عن PwC.
23-06-2025
نينتندو سويتش 2: أسبوعان في - أكبر التحسينات الملحوظة
اكتشف أكبر تحسينات Nintendo Switch 2 بعد أسبوعين من الاستخدام، بما في ذلك شاشتها المذهلة بدقة 1080 بكسل، والتوافق الاستثنائي مع الإصدارات السابقة، وأوقات التحميل الأسرع، وتجربة eShop المحسّنة.
11-06-2025
دليل الهدايا النهائي لعيد الأب للمهوس المحب للمعجبين
اكتشف دليل هدايا عيد الأب المثالي للمهوس المحب للمعجبين في حياتك، والذي يضم ملابس الأبطال الخارقين، والأدوات التقنية، والمقتنيات التي تبعث على الحنين إلى الماضي.
ADVERTISEMENT
13-06-2025
أنكر تستدعي أكثر من مليون بنك طاقة باور كور 10000 وسط مخاوف من اندلاع حريق
استدعت Anker أكثر من 1.1 مليون بنك طاقة PowerCore 10000 بسبب مخاطر الحريق والانفجار. تعرف على كيفية التحقق مما إذا كان جهازك متأثرًا وخطوات الاستبدال.
07-07-2025
الليزر المجهري الصالح للأكل: مستقبل تتبع الأغذية وسلامتها
اكتشف كيف أن الليزر المجهري الصالح للأكل المصنوع من زيت الزيتون سيغير طريقة تتبع الأغذية وسلامتها، ويقدم طريقة ثورية لمراقبة الأغذية والأدوية.
28-07-2025
أحدث هواتف سامسونج القابلة للطي تصل مع مكافآت بطاقات الهدايا؛ سلسلة S25 والساعات مخفضة أيضًا
استكشف أحدث العروض على هواتف سامسونج القابلة للطي الجديدة Galaxy Z Fold7 و Z Flip7، بالإضافة إلى خصومات على S25 Ultra و S25 Edge وسلسلة Galaxy Watch8. اكتشف العروض على Z Flip7 FE والأجهزة المنافسة.
ADVERTISEMENT
20-05-2025
Certis تطلق الروبوتات البشرية في خطوة نحو المستقبل
Certis تطلق أول روبوت بشري في سنغافورة، مستكشفة كيف يمكن للروبوتات تعزيز العمليات الأمنية وإدارة المرافق.
11-07-2025
تحويل الكويكبات: أكثر تعقيدًا مما كان متوقعًا
أبحاث جديدة تكشف أن تحويل مسار كويكب قاتل أكثر تعقيدًا مما كانت تعتقد ناسا في البداية، على الرغم من نجاح مهمة DART.
25-06-2025
مؤلف ويتشر يتفهم تأخير مارتن في 'رياح الشتاء'
أندريه سابكوفسكي، مؤلف سلسلة "الويتشر"، يشارك رؤاه حول سبب استغراق جورج ر. ر. مارتن وقتًا طويلاً لإنهاء "رياح الشتاء"، مشيرًا إلى اقتباس مسلسل "صراع العروش" التلفزيوني.
ADVERTISEMENT
30-06-2025
فك تقنيات التلفزيون: تلفزيونات OLED الاقتصادية، وMini LED، وحدود الإدراك
{ "document": "استكشف أحدث ما توصلت إليه تكنولوجيا التلفزيون، من أجهزة سوني OLEDs الصديقة للميزانية إلى النقاش حول حدود الإدراك البشري، واكتشف أفضل الخيارات مثل باناسونيك W95A وسوني برافيا 8." }
09-06-2025
مركبة الهبوط على أوروبا متوقفة: العلماء يتطلعون إلى إنسيلادوس لفرصة ثانية
ألغت ناسا مهمة المركبة المتجولة إلى أوروبا بسبب التحديات وتخفيضات الميزانية، لكن العلماء يقترحون إعادة توظيف الروبوت المتقدم لمهمة جديدة إلى إنسيلادوس، قمر زحل.
09-08-2025
أجهزة ROG Xbox Ally المحمولة من المقرر إطلاقها في أكتوبر بأسعار مسربة
تشير تقارير مسربة إلى أن أجهزة ROG Xbox Ally المحمولة ستُطلق في 16 أكتوبر 2025، بأسعار تبدأ من 599 يورو للنموذج القياسي و 899 يورو لجهاز Xbox Ally X.
ADVERTISEMENT
12-08-2025
دراسة إماراتية تكشف عن ابتكارات احتجاز الكربون لمستقبل أكثر اخضرارًا
اكتشف إنجازات رائدة في تكنولوجيا احتجاز الكربون من دراسة إماراتية، تتضمن مزيجًا متقدمًا من الأمينات، وأنظمة التأرجح الكهربائي، والمواد العضوية المعدنية (MOFs)، ودورها في تحقيق أهداف الاستدامة بالمنطقة.
21-05-2025
مستقبل الوكلاء الذكيين: كيف تعيد جوجل تشكيل الذكاء الاصطناعي من خلال جيميني ومشروع مارينر
اكتشف كيف تعيد جوجل تشكيل مستقبل الذكاء الاصطناعي من خلال جيميني ومشروع مارينر، مع التركيز على وضع الوكيل والتطبيقات العملية.
19-06-2025
ميدجورني تكشف عن أول نموذج فيديو بالذكاء الاصطناعي وسط دعوى قضائية من ديزني ويونيفرسال
تطلق Midjourney أول نموذج فيديو للذكاء الاصطناعي، V1، وسط دعوى قضائية كبيرة بشأن حقوق النشر من ديزني ويونيفرسال، بهدف توسيع قدراتها في إنشاء المحتوى.
ADVERTISEMENT