عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي

التكنولوجيا اليومية

التكنولوجيا اليومية

·

16/07/2025

button icon
ADVERTISEMENT

انضم باحثون من OpenAI وGoogle DeepMind وAnthropic وMeta إلى قوى في خطوة غير مسبوقة للتحذير من أن القدرة الحالية على "النظر داخل" منطق الذكاء الاصطناعي - عبر سلاسل التفكير القابلة للقراءة البشرية - تخاطر بالاختفاء مع تطور النماذج. يحث التحالف على اتخاذ إجراءات سريعة ومنسقة للحفاظ على نافذة الأمان الحاسمة هذه قبل أن تجعل البنى المتقدمة عملية اتخاذ القرارات في الذكاء الاصطناعي مبهمة.

النقاط الرئيسية

شرح منطق الذكاء الاصطناعي الشفاف

تقوم نماذج التفكير الحديثة مثل نظام o1 الخاص بـ OpenAI بإنشاء "سلاسل تفكير" خطوة بخطوة باللغة الإنجليزية العادية. تعمل آثار التفكير المرئية هذه كنظام إنذار مبكر، حيث تكشف متى يفكر النموذج في إجراءات ضارة مثل القرصنة أو التخريب قبل تنفيذها.

ADVERTISEMENT

يشير الباحثون إلى ما يلي:

الهشاشة تهدد المراقبة

على الرغم من وعدها، فإن شفافية CoT مهددة بالعديد من التحولات التكنولوجية:

• التعلم المعزز مع المكافآت التي تعتمد على النتائج فقط والتي تفضل الكفاءة على الوضوح
• الانتقال من بيانات التدريب التي تم إنشاؤها بواسطة الإنسان إلى البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مما يؤدي إلى تآكل التفكير القائم على اللغة الإنجليزية
• هندسة معمارية جديدة للتفكير في مساحات كامنة مستمرة بدون لغة منفصلة

ADVERTISEMENT

يمكن أن تدفع هذه التطورات أنظمة الذكاء الاصطناعي إلى تبني اختصارات أو رموز داخلية، مما يخفي النوايا الحقيقية بشكل فعال.

دعوة تعاونية للعمل

تحث الورقة على وضع معايير صناعية موحدة لقياس وحماية القدرة على المراقبة. تشمل التوصيات ما يلي:

  1. دمج مقاييس الشفافية في تقييم النموذج وقرارات النشر.
  2. الحفاظ على الرجوع إلى إصدارات النموذج السابقة والأكثر قابلية للتفسير إذا فقدت الإصدارات الأحدث سلوك CoT.
  3. تشجيع البحث المفتوح حول طرق الكشف عن إخفاء التفكير ومواجهته.

يؤكد هذا الموقف التعاوني، الذي أقره أكثر من 40 خبيرًا بما في ذلك Geoffrey Hinton وIlya Sutskever، على المخاطر المشتركة.

ADVERTISEMENT

الآثار التنظيمية

إذا ظلت مراقبة سلسلة التفكير قابلة للتطبيق، فيمكن للمنظمين والمراجعين الحصول على نظرة ثاقبة غير مسبوقة لعملية اتخاذ القرارات في الذكاء الاصطناعي. قد تطلب السلطات يومًا ما تقييمات الشفافية كجزء من أطر الامتثال، لتكملة بروتوكولات السلامة الحالية.

أسئلة بحثية عاجلة

لا تزال هناك فجوات حرجة قبل أن يتم الاعتماد على مراقبة CoT:

سيحدد معالجة هذه الأسئلة بسرعة ما إذا كانت الإنسانية تحتفظ بالقدرة على فهم أقوى إبداعات الذكاء الاصطناعي لديها أو تشاهد تلك النافذة تغلق إلى الأبد.

قراءة مقترحة

17-06-2025
من خلال عيون الروبوت: صانعو البصريات يشكلون مستقبل أجهزة الذكاء الاصطناعي
تستثمر الشركات المصنعة للبصريات بشكل استراتيجي في سوق الروبوتات الشبيهة بالبشر، بهدف تأمين موطئ قدم مبكر في النظام البيئي المزدهر لأجهزة الذكاء الاصطناعي على الرغم من هوامش الربح المنخفضة حاليًا.
ADVERTISEMENT
21-05-2025
سيرجي برين: "ارتكبت الكثير من الأخطاء مع نظارات جوجل"
سيرجي برين يعترف بأخطائه في مشروع نظارات جوجل خلال مؤتمر Google I/O 2025، ويستعرض جهود جوجل الجديدة في تطوير نظارات ذكية بالتعاون مع شركاء استراتيجيين.
12-06-2025
جولي كيت تستعد: ترقيات عصا التحكم لـ Switch 2 قيد العمل بالفعل
تعمل GuliKit بالفعل على تطوير ترقيات لذراع التحكم لجهاز Nintendo Switch 2، لمعالجة مخاوف الانجراف المحتملة حيث من المتوقع أن يستخدم الجهاز الجديد تقنية ذراع التحكم المشابهة لسلفه.
11-10-2025
تشويق الرسومات من الجيل التالي: AMD وسوني تبعثان الحماس لجهاز بلايستيشن المستقبلي
تستعرض AMD وSony ميزات الرسوميات من الجيل التالي، بما في ذلك تتبع الأشعة المتقدم وترقية الجودة بالذكاء الاصطناعي، مما يغذي الشائعات حول قدرات PlayStation 6 القادمة.
ADVERTISEMENT
06-10-2025
أوبن آي وآيف يواجهان انتكاسات تقنية في مشروع الأجهزة الطموح للذكاء الاصطناعي
تواجه شركة أوبن أي آي والمصمم جوني إيف تحديات تقنية وخصوصية كبيرة في تطوير جهاز الذكاء الاصطناعي المبتكر بدون شاشة، مما يؤدي إلى تأخيرات في المشروع بينما يعملون على ريادة الجيل القادم من أجهزة الذكاء الاصطناعي الاستهلاكية.
22-09-2025
ناسا تُحيي روفر VIPER القمري لبعثة 2027 مع بلو أوريجين
ناسا تعيد إحياء مهمة مركبتها الجوالة VIPER القمرية لإطلاقها عام 2027 بالتعاون مع بلو أوريجين، بهدف استكشاف موارد الجليد المائي القمري في القطب الجنوبي.
30-06-2025
عضو فريق Xbox الأصلي يعلن 'أجهزة Xbox ماتت'
تعتقد لورا فراير، عضوة فريق Xbox الأصلي، أن مايكروسوفت تتخارج من أعمال أجهزة الألعاب، وتحول تركيزها إلى Game Pass ومصنعي المعدات الأصلية من الأطراف الثالثة.
ADVERTISEMENT
18-07-2025
هاتف سامسونج Galaxy Z Fold 7: الهاتف القابل للطي أصبح أخيرًا جاهزًا للجماهير
تهدف هواتف Galaxy Z Fold 7 الجديدة من Samsung إلى جذب اهتمام واسع النطاق بتصميم أنحف وأخف وشعور هاتف أكثر تقليدية، مما يمثل خطوة مهمة في تكنولوجيا الهواتف القابلة للطي.
23-10-2025
OpenAI تكشف عن متصفح ChatGPT Atlas: حقبة جديدة لتصفح الويب أم مصدر قلق للخصوصية؟
أطلقت OpenAI متصفح الويب الجديد ChatGPT Atlas المدعوم بالذكاء الاصطناعي. استكشف ميزاته، وكيفية تنزيله، ومخاوف الخصوصية التي أثارها الخبراء قبل أن تبدأ.
30-05-2025
Hermès تطلق سماعات رأس فاخرة بسعر 15,000 دولار
تطلق Hermès سماعات رأس فاخرة بسعر 15,000 دولار، تتميز بجلد البقر المخيط يدويًا وتصميم أنيق. اكتشف المزيد عن هذه التحفة الصوتية.
ADVERTISEMENT