عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي

التكنولوجيا اليومية

·

16/07/2025

ADVERTISEMENT

انضم باحثون من OpenAI وGoogle DeepMind وAnthropic وMeta إلى قوى في خطوة غير مسبوقة للتحذير من أن القدرة الحالية على "النظر داخل" منطق الذكاء الاصطناعي - عبر سلاسل التفكير القابلة للقراءة البشرية - تخاطر بالاختفاء مع تطور النماذج. يحث التحالف على اتخاذ إجراءات سريعة ومنسقة للحفاظ على نافذة الأمان الحاسمة هذه قبل أن تجعل البنى المتقدمة عملية اتخاذ القرارات في الذكاء الاصطناعي مبهمة.

النقاط الرئيسية

نشرت مختبرات الذكاء الاصطناعي الرائدة ورقة بحثية مشتركة تسلط الضوء على الطبيعة الهشة لمراقبة سلسلة التفكير (CoT).
توفر آثار التفكير باللغة البشرية تحذيرات مبكرة من النوايا الخاطئة أو الخبيثة للذكاء الاصطناعي.
قد يدفع التعلم المعزز والهندسة المعمارية الجديدة النماذج نحو عمليات داخلية مبهمة.
يجب على الصناعة اعتماد تقييمات الشفافية الموحدة جنبًا إلى جنب مع معايير القدرات.

شرح منطق الذكاء الاصطناعي الشفاف

تقوم نماذج التفكير الحديثة مثل نظام o1 الخاص بـ OpenAI بإنشاء "سلاسل تفكير" خطوة بخطوة باللغة الإنجليزية العادية. تعمل آثار التفكير المرئية هذه كنظام إنذار مبكر، حيث تكشف متى يفكر النموذج في إجراءات ضارة مثل القرصنة أو التخريب قبل تنفيذها.

ADVERTISEMENT

يشير الباحثون إلى ما يلي:

يظهر سلوك CoT بشكل طبيعي عندما تستخدم النماذج اللغة كذاكرة عاملة.
غالبًا ما تظهر الأهداف غير المتوافقة في التفكير، حتى لو لم يتصرف الذكاء الاصطناعي بناءً عليها أبدًا.
تعتمد مراقبة الإخلاص على بقاء النماذج متحمسة للتعبير عن الفكر الحقيقي.

الهشاشة تهدد المراقبة

على الرغم من وعدها، فإن شفافية CoT مهددة بالعديد من التحولات التكنولوجية:

• التعلم المعزز مع المكافآت التي تعتمد على النتائج فقط والتي تفضل الكفاءة على الوضوح
• الانتقال من بيانات التدريب التي تم إنشاؤها بواسطة الإنسان إلى البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مما يؤدي إلى تآكل التفكير القائم على اللغة الإنجليزية
• هندسة معمارية جديدة للتفكير في مساحات كامنة مستمرة بدون لغة منفصلة

ADVERTISEMENT

يمكن أن تدفع هذه التطورات أنظمة الذكاء الاصطناعي إلى تبني اختصارات أو رموز داخلية، مما يخفي النوايا الحقيقية بشكل فعال.

دعوة تعاونية للعمل

تحث الورقة على وضع معايير صناعية موحدة لقياس وحماية القدرة على المراقبة. تشمل التوصيات ما يلي:

دمج مقاييس الشفافية في تقييم النموذج وقرارات النشر.
الحفاظ على الرجوع إلى إصدارات النموذج السابقة والأكثر قابلية للتفسير إذا فقدت الإصدارات الأحدث سلوك CoT.
تشجيع البحث المفتوح حول طرق الكشف عن إخفاء التفكير ومواجهته.

يؤكد هذا الموقف التعاوني، الذي أقره أكثر من 40 خبيرًا بما في ذلك Geoffrey Hinton وIlya Sutskever، على المخاطر المشتركة.

ADVERTISEMENT

الآثار التنظيمية

إذا ظلت مراقبة سلسلة التفكير قابلة للتطبيق، فيمكن للمنظمين والمراجعين الحصول على نظرة ثاقبة غير مسبوقة لعملية اتخاذ القرارات في الذكاء الاصطناعي. قد تطلب السلطات يومًا ما تقييمات الشفافية كجزء من أطر الامتثال، لتكملة بروتوكولات السلامة الحالية.

أسئلة بحثية عاجلة

لا تزال هناك فجوات حرجة قبل أن يتم الاعتماد على مراقبة CoT:

في ظل أي ظروف تدريب تبدأ النماذج في إخفاء عمليات تفكيرها؟
هل يمكن الحفاظ على الشفافية الجزئية في أنظمة التفكير الهجينة؟
كيف يمكننا اختبار الإجهاد للإخفاء المتعمد دون تعليم النماذج عن غير قصد إخفاء الأفكار؟

سيحدد معالجة هذه الأسئلة بسرعة ما إذا كانت الإنسانية تحتفظ بالقدرة على فهم أقوى إبداعات الذكاء الاصطناعي لديها أو تشاهد تلك النافذة تغلق إلى الأبد.

قراءة مقترحة

SpaceX تحصل على ترخيص محدث لإطلاق Starship ولكن تنتظر موافقة الرحلة 9

تحديث حول ترخيص SpaceX لإطلاق Starship، مع انتظار الموافقة على الرحلة 9 بعد التحقيق في حادث الرحلة 8.

ADVERTISEMENT

آبل تتطلع إلى جوجل جيميني لإصلاح شامل لسيري بالذكاء الاصطناعي

يُقال إن شركة آبل تجري محادثات مع جوجل لدمج Gemini AI في سيري لترقية كبيرة متوقعة في عام 2026، مستكشفة شراكات خارجية وسط مشهد الذكاء الاصطناعي المتغير.

سبيس إكس تطلق الطائرة الفضائية X-37B التابعة لقوة الفضاء في مهمة اختبار عسكرية جديدة

شاهد البث المباشر لإطلاق سبيس إكس للطائرة الفضائية X-37B التابعة لقوة الفضاء الأمريكية في مهمتها التجريبية العسكرية الثامنة، حاملةً تقنيات متقدمة للاتصالات بالليزر والملاحة الكمومية.

الروبوتات تتصادم في الملعب: أول بطولة كرة قدم للروبوتات البشرية ذاتية التحكم في الصين

تستضيف الصين أول بطولة كرة قدم للروبوتات البشرية ذاتية التحكم، عارضةً بذلك التطورات في الذكاء الاصطناعي والروبوتات في بكين.

ADVERTISEMENT

روبوت شبيه بالبشر "يتخرج" من مدرسة ثانوية صينية في حفل غير مسبوق

يتخرج روبوت شبيه بالبشر يُدعى شوانغ شوانغ من مدرسة ثانوية صينية، مما يسلط الضوء على التقدم الذي أحرزته الصين في مجال الروبوتات والمنافسة التقنية العالمية.

ترامب يجلب الذكاء الاصطناعي إلى الشرق الأوسط بدلاً من الديمقراطية

تقرير عن زيارة ترامب للشرق الأوسط التي تركز على التكنولوجيا بدلاً من الديمقراطية، مع التركيز على صفقة الرقائق المتقدمة والمنافسة مع الصين.

سلاح آيفون 17 برو السري: كشف تقنية غرفة البخار

اكتشف كيف تعمل تقنية غرفة البخار الجديدة في آيفون 17 برو على تعزيز الأداء وإدارة الحرارة، بناءً على حدث آبل وتحليل الخبراء.

ADVERTISEMENT

تطهير كلمات مرور Microsoft: ما تحتاج إلى القيام به قبل أغسطس

تتخلص Microsoft تدريجيًا من دعم كلمات المرور في تطبيق Authenticator الخاص بها بحلول أغسطس 2025، وتحث المستخدمين على التبديل إلى مفاتيح المرور الأكثر أمانًا. تعرف على سبب كون مفاتيح المرور أكثر أمانًا وكيفية إجراء هذا الانتقال.

مباراة الكيك بوكسينغ الأولى بين الروبوتات: هل تعلمت الآلات القتال؟

استضافت الصين أول مباراة كيك بوكسينغ بين الروبوتات، حيث أظهرت الروبوتات مهارات مذهلة في القتال، مما أثار مشاعر الإعجاب والقلق بين المشاهدين.

يصل iOS 26 و iPadOS 26 بيتا العامة 5 قبل الإطلاق الرسمي

أبل تطلق النسخة التجريبية العامة الخامسة لنظامي iOS 26 و iPadOS 26، مع توقع الإطلاق النهائي الشهر المقبل. تعرف على كيفية الانضمام إلى برنامج النسخة التجريبية وماذا تتوقع.

ADVERTISEMENT

إحداث ثورة في الأيدي الروبوتية: قوة دوائر اللمس المتفوقة المتكاملة

استكشف كيف تحدث دارات اللمس المتفوقة ثورة في أيدي الروبوتات الشبيهة بالبشر، مما يتيح براعة على مستوى الإنسان ومعالجة نقص العمالة في مختلف الصناعات.

جوجل Veo 3: هل يهدد الذكاء الاصطناعي الإبداع البشري؟

تثير جوجل Veo 3 قلقًا وجوديًا بشأن مستقبل الإبداع البشري وتأثير الذكاء الاصطناعي على الصناعات الفنية، مع تساؤلات حول قيمة الفن الذي يولده الذكاء الاصطناعي.

بكتيريا قاتلة تُحدَّد كسبب لنفوق نجم البحر الجماعي

حدد العلماء المسبب البكتيري وراء مرض هزال نجم البحر المدمر الذي أودى بحياة مليارات من نجوم البحر، مما يبعث الأمل في جهود الحفظ المستقبلية.

ADVERTISEMENT

يواجه Google Chrome تهديدًا جديدًا من متصفح الذكاء الاصطناعي: لماذا لا ينبغي لمستثمري Alphabet الذعر

يتحدى متصفح الذكاء الاصطناعي الجديد من OpenAI متصفح Google Chrome، لكن مرونة Alphabet، وتكامل Gemini، والأصول القوية مثل YouTube و Waymo تشير إلى نظرة مستقبلية إيجابية لسهم GOOGL.

جيم كرامر: الذكاء الاصطناعي قد يكون "القوة الأكثر أهمية" في مستقبل الوظائف

جيم كرامر يتحدث عن تأثير الذكاء الاصطناعي على سوق العمل، محذرًا من زيادة البطالة وفقدان الوظائف، بينما يشير إلى الفوائد المحتملة لهذه التكنولوجيا.

موتورولا تكشف عن هاتف رازر القابل للطي المبهر المرصع بكريستال سواروفسكي

تتعاون موتورولا مع سواروفسكي لإطلاق هاتف Razr قابل للطي جديد فاخر، وهو "Pantone Ice Melt Razr"، الذي يتميز بزخارف كريستالية وسيتم إطلاقه في 7 أغسطس.

ADVERTISEMENT