عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي

التكنولوجيا اليومية

التكنولوجيا اليومية

·

16/07/2025

button icon
ADVERTISEMENT

انضم باحثون من OpenAI وGoogle DeepMind وAnthropic وMeta إلى قوى في خطوة غير مسبوقة للتحذير من أن القدرة الحالية على "النظر داخل" منطق الذكاء الاصطناعي - عبر سلاسل التفكير القابلة للقراءة البشرية - تخاطر بالاختفاء مع تطور النماذج. يحث التحالف على اتخاذ إجراءات سريعة ومنسقة للحفاظ على نافذة الأمان الحاسمة هذه قبل أن تجعل البنى المتقدمة عملية اتخاذ القرارات في الذكاء الاصطناعي مبهمة.

النقاط الرئيسية

شرح منطق الذكاء الاصطناعي الشفاف

تقوم نماذج التفكير الحديثة مثل نظام o1 الخاص بـ OpenAI بإنشاء "سلاسل تفكير" خطوة بخطوة باللغة الإنجليزية العادية. تعمل آثار التفكير المرئية هذه كنظام إنذار مبكر، حيث تكشف متى يفكر النموذج في إجراءات ضارة مثل القرصنة أو التخريب قبل تنفيذها.

ADVERTISEMENT

يشير الباحثون إلى ما يلي:

الهشاشة تهدد المراقبة

على الرغم من وعدها، فإن شفافية CoT مهددة بالعديد من التحولات التكنولوجية:

• التعلم المعزز مع المكافآت التي تعتمد على النتائج فقط والتي تفضل الكفاءة على الوضوح
• الانتقال من بيانات التدريب التي تم إنشاؤها بواسطة الإنسان إلى البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، مما يؤدي إلى تآكل التفكير القائم على اللغة الإنجليزية
• هندسة معمارية جديدة للتفكير في مساحات كامنة مستمرة بدون لغة منفصلة

ADVERTISEMENT

يمكن أن تدفع هذه التطورات أنظمة الذكاء الاصطناعي إلى تبني اختصارات أو رموز داخلية، مما يخفي النوايا الحقيقية بشكل فعال.

دعوة تعاونية للعمل

تحث الورقة على وضع معايير صناعية موحدة لقياس وحماية القدرة على المراقبة. تشمل التوصيات ما يلي:

  1. دمج مقاييس الشفافية في تقييم النموذج وقرارات النشر.
  2. الحفاظ على الرجوع إلى إصدارات النموذج السابقة والأكثر قابلية للتفسير إذا فقدت الإصدارات الأحدث سلوك CoT.
  3. تشجيع البحث المفتوح حول طرق الكشف عن إخفاء التفكير ومواجهته.

يؤكد هذا الموقف التعاوني، الذي أقره أكثر من 40 خبيرًا بما في ذلك Geoffrey Hinton وIlya Sutskever، على المخاطر المشتركة.

ADVERTISEMENT

الآثار التنظيمية

إذا ظلت مراقبة سلسلة التفكير قابلة للتطبيق، فيمكن للمنظمين والمراجعين الحصول على نظرة ثاقبة غير مسبوقة لعملية اتخاذ القرارات في الذكاء الاصطناعي. قد تطلب السلطات يومًا ما تقييمات الشفافية كجزء من أطر الامتثال، لتكملة بروتوكولات السلامة الحالية.

أسئلة بحثية عاجلة

لا تزال هناك فجوات حرجة قبل أن يتم الاعتماد على مراقبة CoT:

سيحدد معالجة هذه الأسئلة بسرعة ما إذا كانت الإنسانية تحتفظ بالقدرة على فهم أقوى إبداعات الذكاء الاصطناعي لديها أو تشاهد تلك النافذة تغلق إلى الأبد.

قراءة مقترحة

11-07-2025
MWC25 الدوحة: حقبة جديدة من الابتكار الرقمي في الشرق الأوسط
من المقرر أن يكون MWC25 الدوحة حدثًا بارزًا، حيث يعرض الذكاء الاصطناعي والجيل الخامس والابتكار الرقمي في الشرق الأوسط، مما يضع قطر كمركز عالمي للتكنولوجيا.
ADVERTISEMENT
12-06-2025
نينتندو سويتش 2 يحطم الأرقام القياسية للمبيعات في أسبوعه الأول
جهاز نينتندو سويتش 2 الجديد يحطم الأرقام القياسية للمبيعات، حيث باع أكثر من 3.5 مليون وحدة في أيامه الأربعة الأولى، مما يشير إلى استقبال قوي في السوق وتوقعات عالية.
27-05-2025
اكتشاف مذهل: علماء يكتشفون معادن ثمينة في صخور بركانية هاواي
اكتشف علماء من جامعة غوتنغن الألمانية معادن ثمينة في صخور بركانية من هاواي، مما يشير إلى تسرب المواد من قلب الأرض إلى الوشاح.
09-07-2025
روبوت شبيه بالبشر "يتخرج" من مدرسة ثانوية صينية في حفل غير مسبوق
يتخرج روبوت شبيه بالبشر يُدعى شوانغ شوانغ من مدرسة ثانوية صينية، مما يسلط الضوء على التقدم الذي أحرزته الصين في مجال الروبوتات والمنافسة التقنية العالمية.
ADVERTISEMENT
26-05-2025
هل يمكن للذكاء الاصطناعي حل أزمة الغذاء العالمية القادمة؟
تستعرض المقالة كيف يمكن للذكاء الاصطناعي أن يسهم في حل أزمة الغذاء العالمية المتزايدة بحلول عام 2050، مع التركيز على أهمية التعاون بين التخصصات.
26-06-2025
الذكاء الاصطناعي Gemini من جوجل: نصوصك، وصولهم، خصوصيتك؟
تثير سياسة جوجل الجديدة لـ Gemini AI مخاوف تتعلق بالخصوصية حيث تكتسب إمكانية الوصول إلى رسائل المستخدم ومكالماته بغض النظر عن إعدادات النشاط، مما يثير جدلاً حول التحكم في البيانات.
20-05-2025
اكتشافات مذهلة: رؤية "أشعة حلقات" زحل عبر تلسكوب هابل
اكتشف ظاهرة "أشعة حلقات" زحل من خلال فيديو مذهل تم التقاطه بواسطة تلسكوب هابل، والذي يعرض الديناميكيات المعقدة في حلقات الكوكب العملاق.
ADVERTISEMENT
24-06-2025
روبوت بشري يحلق: تحقيق أول رحلة على الإطلاق
اكتشف كيف حقق روبوت بشري أول رحلة مستدامة له على الإطلاق، مما يمثل قفزة هائلة في الروبوتات ويفتح إمكانيات جديدة لتطبيقات الروبوتات المتنوعة.
03-07-2025
مصنع هيونداي في جورجيا سيصبح رائداً في نشر روبوت أطلس البشري
ستقوم شركة Hyundai Motor بنشر روبوت Atlas البشري التابع لشركة Boston Dynamics في مصنع السيارات الكهربائية التابع لها في جورجيا في أكتوبر لإجراء أول تجربة ميدانية له، مما يمثل خطوة مهمة في أتمتة التصنيع.
29-05-2025
جوجل صور تحتفل بمرور 10 سنوات على إطلاقها مع أكثر من 9 تريليون صورة وفيديو
احتفلت جوجل صور بمرور 10 سنوات على إطلاقها، مع أكثر من 9 تريليون صورة وفيديو مخزنة، وقدمت ميزات جديدة مثل محرر الصور المعاد تصميمه وأكواد QR لمشاركة الألبومات.
ADVERTISEMENT
11-07-2025
الخاتمة المثالية لـ "ميردر بوت": نهاية مثالية وبداية واعدة
تختتم Apple TV+ اقتباس "يوميات ميردر بوت" لمارثا ويلز موسمه الأول بنهاية مثالية، مما يمهد الطريق للموسم الثاني.
23-05-2025
آبل تخطط لإطلاق نظارات ذكية في 2026 وتلغي ساعة ذكية بكاميرا
تستعد آبل لإطلاق نظارات ذكية بحلول 2026، بينما ألغت خططها لإنتاج ساعة ذكية بكاميرا. تعرف على تفاصيل المشروع وتوجهات الشركة نحو الذكاء الاصطناعي.
25-06-2025
NVIDIA تكشف عن GeForce RTX 5050 الموفر للطاقة
توسع NVIDIA تشكيلة وحدات معالجة الرسوميات الخاصة بها مع بطاقة GeForce RTX 5050 الجديدة، وهي بطاقة رسوميات موفرة للطاقة مصممة لكل من أجهزة الكمبيوتر المحمولة والمكتبية، مما يجلب ميزات RTX المتقدمة إلى جمهور أوسع.
ADVERTISEMENT
03-07-2025
علماء الفيزياء يكشفون لغزًا عمره 50 عامًا حول عزم ثنائي القطب لجزيء حاسم
لقد حل الفيزيائيون لغزًا دام 50 عامًا عن طريق قياس دقيق للعزم الكهربائي ثنائي القطب لأحادي كلوريد الألومنيوم (AlCl)، وهي جزيء بالغ الأهمية للفيزياء الفلكية والحوسبة الكمومية.
29-05-2025
جوجل تكشف عن سبب مشاكل بطارية بيكسل بعد تحديث مايو
جوجل تكشف أن مشاكل بطارية هواتف بيكسل بعد تحديث مايو 2025 ناتجة عن خلل في تطبيق إنستغرام، وليس بسبب التحديث نفسه.
30-05-2025
صعود لابوبو الفيروسي: المضاربون يفسدون متعة الجمع
تُواجه شخصيات لابوبو المحبوبة من بوب مارت تحديات كبيرة بسبب تزايد نشاط البائعين والمضاربين، مما أدى إلى فوضى في المتاجر وعلى الإنترنت.
ADVERTISEMENT