عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي

التكنولوجيا اليومية

التكنولوجيا اليومية

·

16/07/2025

button icon
ADVERTISEMENT

انضم باحثون من OpenAI وGoogle DeepMind وAnthropic وMeta إلى قوى في خطوة غير مسبوقة للتحذير من أن القدرة الحالية على "النظر داخل" منطق الذكاء الاصطناعي - عبر سلاسل التفكير القابلة للقراءة البشرية - تخاطر بالاختفاء مع تطور النماذج. يحث التحالف على اتخاذ إجراءات سريعة ومنسقة للحفاظ على نافذة الأمان الحاسمة هذه قبل أن تجعل البنى المتقدمة عملية اتخاذ القرارات في الذكاء الاصطناعي مبهمة.

النقاط الرئيسية

شرح منطق الذكاء الاصطناعي الشفاف

تقوم نماذج التفكير الحديثة مثل نظام o1 الخاص بـ OpenAI بإنشاء "سلاسل تفكير" خطوة بخطوة باللغة الإنجليزية العادية. تعمل آثار التفكير المرئية هذه كنظام إنذار مبكر، حيث تكشف متى يفكر النموذج في إجراءات ضارة مثل القرصنة أو التخريب قبل تنفيذها.

ADVERTISEMENT

يشير الباحثون إلى ما يلي:

الهشاشة تهدد المراقبة

على الرغم من وعدها، فإن شفافية CoT مهددة بالعديد من التحولات التكنولوجية:

• التعلم المعزز مع المكافآت التي تعتمد على النتائج فقط والتي تفضل الكفاءة على الوضوح
• الانتقال من بيانات التدريب التي تم إنشاؤها بواسطة الإنسان إلى البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مما يؤدي إلى تآكل التفكير القائم على اللغة الإنجليزية
• هندسة معمارية جديدة للتفكير في مساحات كامنة مستمرة بدون لغة منفصلة

ADVERTISEMENT

يمكن أن تدفع هذه التطورات أنظمة الذكاء الاصطناعي إلى تبني اختصارات أو رموز داخلية، مما يخفي النوايا الحقيقية بشكل فعال.

دعوة تعاونية للعمل

تحث الورقة على وضع معايير صناعية موحدة لقياس وحماية القدرة على المراقبة. تشمل التوصيات ما يلي:

  1. دمج مقاييس الشفافية في تقييم النموذج وقرارات النشر.
  2. الحفاظ على الرجوع إلى إصدارات النموذج السابقة والأكثر قابلية للتفسير إذا فقدت الإصدارات الأحدث سلوك CoT.
  3. تشجيع البحث المفتوح حول طرق الكشف عن إخفاء التفكير ومواجهته.

يؤكد هذا الموقف التعاوني، الذي أقره أكثر من 40 خبيرًا بما في ذلك Geoffrey Hinton وIlya Sutskever، على المخاطر المشتركة.

ADVERTISEMENT

الآثار التنظيمية

إذا ظلت مراقبة سلسلة التفكير قابلة للتطبيق، فيمكن للمنظمين والمراجعين الحصول على نظرة ثاقبة غير مسبوقة لعملية اتخاذ القرارات في الذكاء الاصطناعي. قد تطلب السلطات يومًا ما تقييمات الشفافية كجزء من أطر الامتثال، لتكملة بروتوكولات السلامة الحالية.

أسئلة بحثية عاجلة

لا تزال هناك فجوات حرجة قبل أن يتم الاعتماد على مراقبة CoT:

سيحدد معالجة هذه الأسئلة بسرعة ما إذا كانت الإنسانية تحتفظ بالقدرة على فهم أقوى إبداعات الذكاء الاصطناعي لديها أو تشاهد تلك النافذة تغلق إلى الأبد.

قراءة مقترحة

18-06-2025
جوجل تطلق نماذج Gemini 2.5 AI الجاهزة للإنتاج، مما يكثف التحدي لـ OpenAI
تطلق جوجل نماذج Gemini 2.5 AI الجاهزة للإنتاج، بما في ذلك Pro و Flash و Flash-Lite، لتحدي هيمنة OpenAI على الشركات من خلال تعزيز التفكير والعروض المتدرجة والتسعير القوي.
ADVERTISEMENT
16-06-2025
نينتندو سويتش 2 يحطم الأرقام القياسية للمبيعات، ويصبح أسرع جهاز ألعاب مبيعًا في تاريخ الولايات المتحدة
نينتندو سويتش 2 يحطم الأرقام القياسية للمبيعات في الولايات المتحدة واليابان، ليصبح الأجهزة الأسرع مبيعًا في تاريخ الألعاب ويضع معايير عالمية جديدة.
23-06-2025
مارشال كيلبورن الثالث: مكبر صوت بلوتوث يعيد تعريف التميز الصوتي
اكتشف لماذا يوفر مكبر الصوت Marshall Kilburn III Bluetooth، بسعر 379 دولارًا، جودة صوت فائقة وتصميمًا تناظريًا كلاسيكيًا يتفوق على العديد من أنظمة الصوت الأكثر تكلفة.
13-06-2025
نموذج الذكاء الاصطناعي الجديد من ميتا يفهم الجاذبية: قفزة نحو آلات أكثر ذكاءً
نموذج الذكاء الاصطناعي الجديد من ميتا، V-JEPA 2، يفهم القواعد الفيزيائية مثل الجاذبية، مما يمهد الطريق لروبوتات وأنظمة ذاتية أكثر ذكاءً.
ADVERTISEMENT
07-07-2025
Lenovo Chromebook Plus 14: البطل الجديد المتوج لأجهزة Chromebook
اكتشف لماذا يتم الإشادة بجهاز Lenovo Chromebook Plus 14 باعتباره الملك الجديد لأجهزة Chromebook، حيث يقدم شاشة OLED وأداءً قويًا وعمر بطارية استثنائيًا بسعر تنافسي.
22-05-2025
نقاش حر حول الذكاء الاصطناعي في سان فرانسيسكو: هل ستنجو الحقيقة؟
نقاش حر حول تأثير الذكاء الاصطناعي على الحقيقة في سان فرانسيسكو، حيث اجتمع 900 شخص لمناقشة الآراء المتباينة بين التفاؤل والتشاؤم.
28-05-2025
استكشاف ABB لبيع وحدة الروبوتات بقيمة 3.5 مليار دولار
تستعد شركة ABB لاستكشاف بيع وحدة الروبوتات بقيمة 3.5 مليار دولار، في خطوة تهدف إلى تركيز الشركة على مجالات أكثر ربحية مثل الكهرباء.
ADVERTISEMENT
15-07-2025
تحطيم الأرقام القياسية النيزك المريخي معروض للبيع في مزاد
أكبر نيزك مريخي تم العثور عليه على الإطلاق، NWA 16788، من المقرر أن يتم بيعه في مزاد علني بواسطة Sotheby's، بقيمة تقدر تصل إلى 4 ملايين دولار. يقدم هذا الحجر الفضائي الذي يزن 54 رطلاً لمحة نادرة عن تاريخ الكوكب الأحمر.
03-07-2025
علماء الفيزياء يكشفون لغزًا عمره 50 عامًا حول عزم ثنائي القطب لجزيء حاسم
لقد حل الفيزيائيون لغزًا دام 50 عامًا عن طريق قياس دقيق للعزم الكهربائي ثنائي القطب لأحادي كلوريد الألومنيوم (AlCl)، وهي جزيء بالغ الأهمية للفيزياء الفلكية والحوسبة الكمومية.
17-07-2025
تشكيلة Pixel 10 المدعومة بالذكاء الاصطناعي من Google تظهر لأول مرة في 20 أغسطس
ستكشف Google عن سلسلة Pixel 10 و Pixel Watch 4 المدعومة بالذكاء الاصطناعي في 20 أغسطس في نيويورك، حيث ستعرض ميزات الذكاء الاصطناعي المتقدمة وعوامل الشكل الجديدة.
ADVERTISEMENT
02-07-2025
الروبوتات في الفنادق: إقامة مستقبلية أم لقاء غريب؟
استكشف كيف تستخدم الفنادق الروبوتات بشكل متزايد لخدمات الضيوف، وردود الفعل المتباينة من المسافرين، ومستقبل الذكاء الاصطناعي في صناعة الضيافة.
23-05-2025
تحديث ضخم لجهاز Steam Deck من Valve يدعم أجهزة AMD المنافسة
تحديث جديد لجهاز Steam Deck من Valve يدعم أجهزة AMD المحمولة، مع ميزات جديدة وتحسينات في الأداء.
11-06-2025
اختبار التزود بالوقود المداري الصيني: تغيير قواعد اللعبة تحت التدقيق الأمريكي
تجري الصين اختبارًا حاسمًا للتزود بالوقود في المدار في المدار الثابت بالنسبة للأرض، وهي خطوة يمكن أن تطيل عمر الأقمار الصناعية بشكل كبير، بينما يراقب قمران صناعيان أمريكيان المناورة الاستراتيجية عن كثب.
ADVERTISEMENT
15-07-2025
ظهور قمر صناعي صيني سري في مدار غير مسبوق بعد اختفاء دام أسبوعًا
اختفى قمر صناعي صيني سري، شييان-28 بي 01، لمدة ستة أيام بعد الإطلاق قبل أن يظهر مجددًا في مدار منخفض غير مسبوق، مما أثار تكهنات حول الغرض منه.
26-05-2025
جوجل تستثمر في نموذجها العالمي: بناء طبقة الذكاء الاصطناعي قبل أن تسيطر مايكروسوفت على واجهة المستخدم
تستعرض جوجل استراتيجيتها لبناء نموذج عالمي للذكاء الاصطناعي خلال حدث I/O 2025، مع التركيز على الابتكارات والتحديات في مواجهة المنافسة.
29-05-2025
هجوم خبيث يستهدف آلاف أجهزة توجيه Asus
آلاف أجهزة توجيه Asus تتعرض لهجوم خبيث يتمثل في وجود أبواب خلفية مستمرة، مما يهدد أمان الشبكات المنزلية.
ADVERTISEMENT