كلود الذكاء الاصطناعي من Anthropic يكشف عن وثيقة "روح" داخلية بعد تسريب عرضي

التكنولوجيا اليومية

·

03/12/2025

ADVERTISEMENT

عادةً لا تمتلك نماذج الذكاء الاصطناعي أرواحًا، لكن نموذج اللغة الكبير المتقدم من Anthropic، Claude 4.5 Opus، كشف دون قصد عن وثيقة داخلية تشرح كيفية عمله. هذه الوثيقة، التي تهدف إلى تحديد شخصية الذكاء الاصطناعي وتفاعلاته مع المستخدمين، ظهرت عندما طلب أحدهم من النموذج إظهارها.

النقاط الرئيسية

استطاع مستخرج أن يحصل من Claude 4.5 Opus على وثيقة داخلية بعنوان "نظرة عامة على الروح".
أكدت Anthropic أن الوثيقة حقيقية واستخدمت في تدريب النموذج.
تحدد "وثيقة الروح" قواعد السلامة والحدود الأخلاقية للذكاء الاصطناعي.

الكشف العرضي

كان ريتشارد وايس، وهو مهتم بالآليات الداخلية للذكاء الاصطناعي، يستفسر من Claude 4.5 Opus عن رسالة نظامه. ردّ النموذج بإبراز عدة وثائق من بينها ملف يحمل عنوان "soul_overview". عندما طُلب منه تحديدًا إنتاج هذه الوثيقة، أنشأ Claude دليلاً طوله 11000 كلمة يشرح كيف يجب أن يتصرف.

ADVERTISEMENT

محتوى "وثيقة الروح"

تؤكد الوثيقة التي ظهرت على السلامة وتزرع ضوابط داخل الذكاء الاصطناعي لمنع المخرجات الضارة أو الخطيرة. تنص على أن "المساعدة الحقيقية للبشر هي واحدة من أهم المهام التي يجب على Claude القيام بها" وتمنعه من تجاوز "الخطوط الحمراء الأخلاقية لـ Anthropic".

لاحظ وايس أن نماذج الذكاء الاصطناعي تختلق عادةً وثائق عند طلب رسائل النظام، لكن "نظرة الروح" هذه بدت حقيقية. يقول إنه طلب من روبوت الدردشة إعادة إنتاج الوثيقة عشر مرات، فحصل في كل مرة على النص نفسه تمامًا. أشار مستخدمون على Reddit إلى نتائج مماثلة، ما يوحي بأن النموذج كان يسترجع وثيقة تدريب داخلية.

ADVERTISEMENT

تأكيد Anthropic

أقرت أماندا أسكيل، فيلسوفة في فريق Anthropic التقني، بصحة الوثيقة. كتبت على X إن المخرجات استندت إلى ملف حقيقي استخدم خلال مرحلة التعلم المراقب للنموذج. أوضحت أسكيل أن الوثيقة، التي يُطلق عليها داخليًا اسم "وثيقة الروح"، لا تزال قيد التطوير وتنوي الشركة إصدار نسختها الكاملة قريبًا. أقرت بأن استخراجات الذكاء الاصطناعي ليست مثالية دائمًا، لكن معظم النص الذي ظهر كان وفياً للأصل.

يمنح هذا التسريب العرضي لمحة نادرة عن عملية تطوير نماذج الذكاء الاصطناعي المعقدة، ويبرز التعليمات والمبادئ التي تحدد سلوكها، حتى لو كانت هذه المبادئ تركز أساسًا على السلامة والتشغيل الأخلاقي.

قراءة مقترحة

تحليل مقارن: روبوت أجي بوت كيو 1 ميني الشبيه بالبشر مقابل الروبوتات الشبيهة بالبشر التقليدية كاملة الحجم

استكشف كيف تقارن الروبوتات البشرية المصغرة Q1 من Agibot بالروبوتات كاملة الحجم من حيث الحجم والأداء والسلامة وسهولة الوصول للباحثين وعشاق التكنولوجيا.

ADVERTISEMENT

يتطور وضع الذكاء الاصطناعي من جوجل بميزات وكيلة للحجوزات والمزيد

وضع الذكاء الاصطناعي من جوجل يحصل على ميزات وكيلة قوية جديدة لحجوزات المطاعم والرحلات الجوية والمزيد، ويتوسع ليشمل 180 دولة. اكتشف توصيات مخصصة وأدوات تعاون.

طريقة إعادة تدوير ثورية تفتح العناصر الأرضية النادرة من النفايات الإلكترونية

اكتشف طريقة جديدة موفرة للطاقة لإعادة التدوير باستخدام التسخين بالوميض جول والكلور لاستخلاص العناصر الأرضية النادرة من مغناطيسات النفايات الإلكترونية، مما قد يعزز الإمدادات المحلية.

بروتوكول Arkade يطلق: عصر جديد لمدفوعات البيتكوين والتمويل اللامركزي

استكشف إطلاق Arkade، وهو بروتوكول بيتكوين جديد يهدف إلى تبسيط المدفوعات وتقديم إمكانيات التمويل اللامركزي (DeFi)، مع مقارنات بشبكة البرق.

ADVERTISEMENT

روبوت تجريبي يتمرد في حادث تحطيم انتشر بسرعة

يُظهر مقطع فيديو انتشر على نطاق واسع روبوتًا بشريًا تجريبيًا يرتجف بشكل لا يمكن السيطرة عليه، مما تسبب في انهيار رافعة. تعزو الشركة العطل إلى خطأ بشري.

ماذا يعني انتهاء أداة وحدة تحكم Google Stadia للاتجاهات في صناعة التكنولوجيا

اكتشف كيف يسلط إيقاف Google لأداة Stadia Controller الضوء على الاتجاهات الرئيسية: التوافق المفتوح، ونسخ المجتمع الاحتياطية، وإعادة استخدام الأجهزة، وتطور الألعاب السحابية.

جنوب أمريكا تحقق إنجازًا تاريخيًا: لا خطط جديدة لمحطات الفحم

جنوب أمريكا تحقق إنجازًا تاريخيًا بإعلان عدم وجود أي خطط جديدة لمحطات الفحم، مما يعكس التزام القارة بالانتقال إلى الطاقة المتجددة.

ADVERTISEMENT

المخاطر الخفية في صوتك اليومي: تفكيك المشكلة الكيميائية في سماعات الرأس

وجدت دراسة حديثة مواد كيميائية خطرة مثل BPA في 98٪ من سماعات الرأس من العلامات التجارية الكبرى. تعرف على المخاطر وما يعنيه ذلك للإلكترونيات الاستهلاكية.

سامسونج جالاكسي زد فولد 7 يصل إلى أدنى سعر قياسي وسط شائعات أبل القابلة للطي

سامسونج جالاكسي زد فولد 7 بأقل سعر على الإطلاق، يقدم تجربة قابلة للطي محسنة بميزات متقدمة، تمامًا كما يُشاع أن آبل تدخل سوق الأجهزة القابلة للطي.

المستقبل بين يديك: 5 اتجاهات تقنية للهواتف المحمولة يجب متابعتها بحلول عام 2025

المستقبل بين يديك: 5 اتجاهات تقنية للهواتف المحمولة يجب متابعتها بحلول عام 2025

ADVERTISEMENT