عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي

التكنولوجيا اليومية

التكنولوجيا اليومية

·

16/07/2025

button icon
ADVERTISEMENT

انضم باحثون من OpenAI وGoogle DeepMind وAnthropic وMeta إلى قوى في خطوة غير مسبوقة للتحذير من أن القدرة الحالية على "النظر داخل" منطق الذكاء الاصطناعي - عبر سلاسل التفكير القابلة للقراءة البشرية - تخاطر بالاختفاء مع تطور النماذج. يحث التحالف على اتخاذ إجراءات سريعة ومنسقة للحفاظ على نافذة الأمان الحاسمة هذه قبل أن تجعل البنى المتقدمة عملية اتخاذ القرارات في الذكاء الاصطناعي مبهمة.

النقاط الرئيسية

شرح منطق الذكاء الاصطناعي الشفاف

تقوم نماذج التفكير الحديثة مثل نظام o1 الخاص بـ OpenAI بإنشاء "سلاسل تفكير" خطوة بخطوة باللغة الإنجليزية العادية. تعمل آثار التفكير المرئية هذه كنظام إنذار مبكر، حيث تكشف متى يفكر النموذج في إجراءات ضارة مثل القرصنة أو التخريب قبل تنفيذها.

ADVERTISEMENT

يشير الباحثون إلى ما يلي:

الهشاشة تهدد المراقبة

على الرغم من وعدها، فإن شفافية CoT مهددة بالعديد من التحولات التكنولوجية:

• التعلم المعزز مع المكافآت التي تعتمد على النتائج فقط والتي تفضل الكفاءة على الوضوح
• الانتقال من بيانات التدريب التي تم إنشاؤها بواسطة الإنسان إلى البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مما يؤدي إلى تآكل التفكير القائم على اللغة الإنجليزية
• هندسة معمارية جديدة للتفكير في مساحات كامنة مستمرة بدون لغة منفصلة

ADVERTISEMENT

يمكن أن تدفع هذه التطورات أنظمة الذكاء الاصطناعي إلى تبني اختصارات أو رموز داخلية، مما يخفي النوايا الحقيقية بشكل فعال.

دعوة تعاونية للعمل

تحث الورقة على وضع معايير صناعية موحدة لقياس وحماية القدرة على المراقبة. تشمل التوصيات ما يلي:

  1. دمج مقاييس الشفافية في تقييم النموذج وقرارات النشر.
  2. الحفاظ على الرجوع إلى إصدارات النموذج السابقة والأكثر قابلية للتفسير إذا فقدت الإصدارات الأحدث سلوك CoT.
  3. تشجيع البحث المفتوح حول طرق الكشف عن إخفاء التفكير ومواجهته.

يؤكد هذا الموقف التعاوني، الذي أقره أكثر من 40 خبيرًا بما في ذلك Geoffrey Hinton وIlya Sutskever، على المخاطر المشتركة.

ADVERTISEMENT

الآثار التنظيمية

إذا ظلت مراقبة سلسلة التفكير قابلة للتطبيق، فيمكن للمنظمين والمراجعين الحصول على نظرة ثاقبة غير مسبوقة لعملية اتخاذ القرارات في الذكاء الاصطناعي. قد تطلب السلطات يومًا ما تقييمات الشفافية كجزء من أطر الامتثال، لتكملة بروتوكولات السلامة الحالية.

أسئلة بحثية عاجلة

لا تزال هناك فجوات حرجة قبل أن يتم الاعتماد على مراقبة CoT:

سيحدد معالجة هذه الأسئلة بسرعة ما إذا كانت الإنسانية تحتفظ بالقدرة على فهم أقوى إبداعات الذكاء الاصطناعي لديها أو تشاهد تلك النافذة تغلق إلى الأبد.

قراءة مقترحة

18-07-2025
ساعة Pixel Watch 4: قفزة نحو قابلية الإصلاح والاستدامة
يشاع أن ساعة Pixel Watch 4 القادمة ستكون قابلة للإصلاح، وهو تغيير كبير عن النماذج السابقة التي كانت عرضة لأن تصبح نفايات إلكترونية في حالة تلفها. يتماشى هذا التحول مع أهداف Google للاستدامة.
ADVERTISEMENT
26-06-2025
الذكاء الاصطناعي يحيي فيلم 'ساحر أوز' في ذا سفير، مما يثير جدلاً حول الحفاظ على الأفلام
يأتي فيلم ساحر أوز إلى ذا سفير في لاس فيغاس، باستخدام الذكاء الاصطناعي لتكييف الفيلم الكلاسيكي مع المكان الغامر. تثير هذه الخطوة جدلاً حول الحفاظ على الأفلام والتحسين التكنولوجي.
19-06-2025
هيكساجون تكشف عن أيون: الروبوت البشري المدعوم من إنفيديا الذي يُحدث ثورة في الأتمتة الصناعية
كشفت Hexagon عن Aeon، وهو روبوت بشري يعمل بتقنية Nvidia وMicrosoft Azure، ومصمم لأتمتة مهام المصانع والبناء، مستفيدًا من الذكاء الاصطناعي والتوائم الرقمية لتعزيز الكفاءة.
23-05-2025
الرؤساء التنفيذيون في مجال التكنولوجيا يستخدمون الذكاء الاصطناعي لاستبدال أنفسهم
تقرير عن استخدام الرؤساء التنفيذيين في مجال التكنولوجيا للذكاء الاصطناعي لاستبدال أنفسهم في مكالمات الأرباح، وتأثير ذلك على القوى العاملة.
ADVERTISEMENT
15-07-2025
عشرات من "المجرات الشبحية" قد تدور حول درب التبانة، كما يشتبه علماء الفلك
تشير أبحاث جديدة إلى أن العشرات من "المجرات الشبحية" قد تدور حول مجرة درب التبانة، مما قد يحل لغزًا طال أمده في علم الكونيات ويعزز نظرية المادة المظلمة الباردة لامدا.
09-07-2025
إحداث ثورة في الأيدي الروبوتية: قوة دوائر اللمس المتفوقة المتكاملة
استكشف كيف تحدث دارات اللمس المتفوقة ثورة في أيدي الروبوتات الشبيهة بالبشر، مما يتيح براعة على مستوى الإنسان ومعالجة نقص العمالة في مختلف الصناعات.
07-07-2025
دوري كرة القدم للروبوتات في الصين: مستقبل الذكاء الاصطناعي في الملعب
اكتشف دوري RoBoLeague الصيني الرائد، وهو أول دوري لكرة القدم للروبوتات الشبيهة بالبشر، يعرض روبوتات مستقلة تعمل بالذكاء الاصطناعي تتنافس للنهوض بتكنولوجيا الروبوتات والذكاء الاصطناعي.
ADVERTISEMENT
08-07-2025
نظرة خاطفة على مستقبل الهواتف الذكية ثلاثية الطي: Tecno Phantom Ultimate G Fold
يشاع أن هاتف Tecno Phantom Ultimate G Fold ثلاثي الطي القابل للطي سيطلق في منتصف يوليو، ويتميز بتصميم مبتكر قابل للطي للداخل. تعرف على ميزاته والتوقيت الاستراتيجي لإطلاقه في السوق.
11-06-2025
أندرويد 16 يطلق أربع ترقيات مجانية رئيسية لهاتفك
اكتشف الترقيات المجانية الأربع الرئيسية القادمة لهواتف Android مع إصدار Android 16، مما يعزز الأمان والإنتاجية وتجربة المستخدم.
21-07-2025
جونو يكشف عن موجة بلازما جديدة فوق القطب الشمالي للمشتري
اكتشف مسبار جونو التابع لناسا نوعًا جديدًا من موجات البلازما فوق القطب الشمالي لكوكب المشتري، مما يقدم رؤى حول الغلاف الجوي للكوكب والمغناطيسية الكوكبية الخارجية.
ADVERTISEMENT
30-05-2025
صعود لابوبو الفيروسي: المضاربون يفسدون متعة الجمع
تُواجه شخصيات لابوبو المحبوبة من بوب مارت تحديات كبيرة بسبب تزايد نشاط البائعين والمضاربين، مما أدى إلى فوضى في المتاجر وعلى الإنترنت.
11-07-2025
تحويل الكويكبات: أكثر تعقيدًا مما كان متوقعًا
أبحاث جديدة تكشف أن تحويل مسار كويكب قاتل أكثر تعقيدًا مما كانت تعتقد ناسا في البداية، على الرغم من نجاح مهمة DART.
15-07-2025
جروك يكشف النقاب عن رفقاء الذكاء الاصطناعي، بما في ذلك فتاة أنمي قوطية، وسط مخاوف تتعلق بالسلامة
يقدم روبوت الدردشة Grok AI الخاص بإيلون ماسك "رفقاء AI" جدد للمشتركين المتميزين، بما في ذلك فتاة أنمي قوطية، مما يثير تساؤلات حول علاقات الذكاء الاصطناعي والسلامة.
ADVERTISEMENT
28-05-2025
إيباي تقطع أكثر من 200 وظيفة في TCGplayer وسط توترات عمالية
إيباي تعلن عن تسريح 220 موظفًا في TCGplayer وسط توترات مع النقابة، مما يثير قلقًا كبيرًا بين العمال.
29-05-2025
فهم مشاعر الخيول من خلال تعبيرات الوجه
دراسة جديدة تكشف عن كيفية استخدام الخيول لتعبيرات وجهها للتواصل، مما يساعد في فهم مشاعرها ورفاهيتها.
01-07-2025
نيو: الروبوت الشبيه بالبشر الذي يتقن الغسيل ويعيد تعريف أتمتة المنزل
اكتشف كيف يتم تدريب الروبوت البشري Neo لأداء مهام منزلية معقدة مثل غسيل الملابس، مما يمثل خطوة مهمة في مجال الروبوتات المنزلية.
ADVERTISEMENT