كلود الذكاء الاصطناعي من Anthropic يكشف عن وثيقة "روح" داخلية بعد تسريب عرضي

التكنولوجيا اليومية

التكنولوجيا اليومية

·

03/12/2025

button icon
ADVERTISEMENT

عادةً لا تمتلك نماذج الذكاء الاصطناعي أرواحًا، لكن نموذج اللغة الكبير المتقدم من Anthropic، Claude 4.5 Opus، كشف دون قصد عن وثيقة داخلية تشرح كيفية عمله. هذه الوثيقة، التي تهدف إلى تحديد شخصية الذكاء الاصطناعي وتفاعلاته مع المستخدمين، ظهرت عندما طلب أحدهم من النموذج إظهارها.

النقاط الرئيسية

الكشف العرضي

كان ريتشارد وايس، وهو مهتم بالآليات الداخلية للذكاء الاصطناعي، يستفسر من Claude 4.5 Opus عن رسالة نظامه. ردّ النموذج بإبراز عدة وثائق من بينها ملف يحمل عنوان "soul_overview". عندما طُلب منه تحديدًا إنتاج هذه الوثيقة، أنشأ Claude دليلاً طوله 11000 كلمة يشرح كيف يجب أن يتصرف.

ADVERTISEMENT

محتوى "وثيقة الروح"

تؤكد الوثيقة التي ظهرت على السلامة وتزرع ضوابط داخل الذكاء الاصطناعي لمنع المخرجات الضارة أو الخطيرة. تنص على أن "المساعدة الحقيقية للبشر هي واحدة من أهم المهام التي يجب على Claude القيام بها" وتمنعه من تجاوز "الخطوط الحمراء الأخلاقية لـ Anthropic".

لاحظ وايس أن نماذج الذكاء الاصطناعي تختلق عادةً وثائق عند طلب رسائل النظام، لكن "نظرة الروح" هذه بدت حقيقية. يقول إنه طلب من روبوت الدردشة إعادة إنتاج الوثيقة عشر مرات، فحصل في كل مرة على النص نفسه تمامًا. أشار مستخدمون على Reddit إلى نتائج مماثلة، ما يوحي بأن النموذج كان يسترجع وثيقة تدريب داخلية.

ADVERTISEMENT

تأكيد Anthropic

أقرت أماندا أسكيل، فيلسوفة في فريق Anthropic التقني، بصحة الوثيقة. كتبت على X إن المخرجات استندت إلى ملف حقيقي استخدم خلال مرحلة التعلم المراقب للنموذج. أوضحت أسكيل أن الوثيقة، التي يُطلق عليها داخليًا اسم "وثيقة الروح"، لا تزال قيد التطوير وتنوي الشركة إصدار نسختها الكاملة قريبًا. أقرت بأن استخراجات الذكاء الاصطناعي ليست مثالية دائمًا، لكن معظم النص الذي ظهر كان وفياً للأصل.

يمنح هذا التسريب العرضي لمحة نادرة عن عملية تطوير نماذج الذكاء الاصطناعي المعقدة، ويبرز التعليمات والمبادئ التي تحدد سلوكها، حتى لو كانت هذه المبادئ تركز أساسًا على السلامة والتشغيل الأخلاقي.

قراءة مقترحة

05-01-2026
تحليل مقارن: روبوت أجي بوت كيو 1 ميني الشبيه بالبشر مقابل الروبوتات الشبيهة بالبشر التقليدية كاملة الحجم
استكشف كيف تقارن الروبوتات البشرية المصغرة Q1 من Agibot بالروبوتات كاملة الحجم من حيث الحجم والأداء والسلامة وسهولة الوصول للباحثين وعشاق التكنولوجيا.
ADVERTISEMENT
22-08-2025
يتطور وضع الذكاء الاصطناعي من جوجل بميزات وكيلة للحجوزات والمزيد
وضع الذكاء الاصطناعي من جوجل يحصل على ميزات وكيلة قوية جديدة لحجوزات المطاعم والرحلات الجوية والمزيد، ويتوسع ليشمل 180 دولة. اكتشف توصيات مخصصة وأدوات تعاون.
21-10-2025
طريقة إعادة تدوير ثورية تفتح العناصر الأرضية النادرة من النفايات الإلكترونية
اكتشف طريقة جديدة موفرة للطاقة لإعادة التدوير باستخدام التسخين بالوميض جول والكلور لاستخلاص العناصر الأرضية النادرة من مغناطيسات النفايات الإلكترونية، مما قد يعزز الإمدادات المحلية.
23-10-2025
بروتوكول Arkade يطلق: عصر جديد لمدفوعات البيتكوين والتمويل اللامركزي
استكشف إطلاق Arkade، وهو بروتوكول بيتكوين جديد يهدف إلى تبسيط المدفوعات وتقديم إمكانيات التمويل اللامركزي (DeFi)، مع مقارنات بشبكة البرق.
ADVERTISEMENT
22-07-2025
روبوت تجريبي يتمرد في حادث تحطيم انتشر بسرعة
يُظهر مقطع فيديو انتشر على نطاق واسع روبوتًا بشريًا تجريبيًا يرتجف بشكل لا يمكن السيطرة عليه، مما تسبب في انهيار رافعة. تعزو الشركة العطل إلى خطأ بشري.
21-01-2026
ماذا يعني انتهاء أداة وحدة تحكم Google Stadia للاتجاهات في صناعة التكنولوجيا
اكتشف كيف يسلط إيقاف Google لأداة Stadia Controller الضوء على الاتجاهات الرئيسية: التوافق المفتوح، ونسخ المجتمع الاحتياطية، وإعادة استخدام الأجهزة، وتطور الألعاب السحابية.
22-05-2025
جنوب أمريكا تحقق إنجازًا تاريخيًا: لا خطط جديدة لمحطات الفحم
جنوب أمريكا تحقق إنجازًا تاريخيًا بإعلان عدم وجود أي خطط جديدة لمحطات الفحم، مما يعكس التزام القارة بالانتقال إلى الطاقة المتجددة.
ADVERTISEMENT
19-02-2026
المخاطر الخفية في صوتك اليومي: تفكيك المشكلة الكيميائية في سماعات الرأس
وجدت دراسة حديثة مواد كيميائية خطرة مثل BPA في 98٪ من سماعات الرأس من العلامات التجارية الكبرى. تعرف على المخاطر وما يعنيه ذلك للإلكترونيات الاستهلاكية.
18-12-2025
سامسونج جالاكسي زد فولد 7 يصل إلى أدنى سعر قياسي وسط شائعات أبل القابلة للطي
سامسونج جالاكسي زد فولد 7 بأقل سعر على الإطلاق، يقدم تجربة قابلة للطي محسنة بميزات متقدمة، تمامًا كما يُشاع أن آبل تدخل سوق الأجهزة القابلة للطي.
04-11-2025
المستقبل بين يديك: 5 اتجاهات تقنية للهواتف المحمولة يجب متابعتها بحلول عام 2025
المستقبل بين يديك: 5 اتجاهات تقنية للهواتف المحمولة يجب متابعتها بحلول عام 2025
ADVERTISEMENT