كلود الذكاء الاصطناعي من Anthropic يكشف عن وثيقة "روح" داخلية بعد تسريب عرضي

التكنولوجيا اليومية

التكنولوجيا اليومية

·

03/12/2025

button icon
ADVERTISEMENT

عادةً لا تمتلك نماذج الذكاء الاصطناعي أرواحًا، لكن نموذج اللغة الكبير المتقدم من Anthropic، Claude 4.5 Opus، كشف دون قصد عن وثيقة داخلية تشرح كيفية عمله. هذه الوثيقة، التي تهدف إلى تحديد شخصية الذكاء الاصطناعي وتفاعلاته مع المستخدمين، ظهرت عندما طلب أحدهم من النموذج إظهارها.

النقاط الرئيسية

الكشف العرضي

كان ريتشارد وايس، وهو مهتم بالآليات الداخلية للذكاء الاصطناعي، يستفسر من Claude 4.5 Opus عن رسالة نظامه. ردّ النموذج بإبراز عدة وثائق من بينها ملف يحمل عنوان "soul_overview". عندما طُلب منه تحديدًا إنتاج هذه الوثيقة، أنشأ Claude دليلاً طوله 11000 كلمة يشرح كيف يجب أن يتصرف.

ADVERTISEMENT

محتوى "وثيقة الروح"

تؤكد الوثيقة التي ظهرت على السلامة وتزرع ضوابط داخل الذكاء الاصطناعي لمنع المخرجات الضارة أو الخطيرة. تنص على أن "المساعدة الحقيقية للبشر هي واحدة من أهم المهام التي يجب على Claude القيام بها" وتمنعه من تجاوز "الخطوط الحمراء الأخلاقية لـ Anthropic".

لاحظ وايس أن نماذج الذكاء الاصطناعي تختلق عادةً وثائق عند طلب رسائل النظام، لكن "نظرة الروح" هذه بدت حقيقية. يقول إنه طلب من روبوت الدردشة إعادة إنتاج الوثيقة عشر مرات، فحصل في كل مرة على النص نفسه تمامًا. أشار مستخدمون على Reddit إلى نتائج مماثلة، ما يوحي بأن النموذج كان يسترجع وثيقة تدريب داخلية.

ADVERTISEMENT

تأكيد Anthropic

أقرت أماندا أسكيل، فيلسوفة في فريق Anthropic التقني، بصحة الوثيقة. كتبت على X إن المخرجات استندت إلى ملف حقيقي استخدم خلال مرحلة التعلم المراقب للنموذج. أوضحت أسكيل أن الوثيقة، التي يُطلق عليها داخليًا اسم "وثيقة الروح"، لا تزال قيد التطوير وتنوي الشركة إصدار نسختها الكاملة قريبًا. أقرت بأن استخراجات الذكاء الاصطناعي ليست مثالية دائمًا، لكن معظم النص الذي ظهر كان وفياً للأصل.

يمنح هذا التسريب العرضي لمحة نادرة عن عملية تطوير نماذج الذكاء الاصطناعي المعقدة، ويبرز التعليمات والمبادئ التي تحدد سلوكها، حتى لو كانت هذه المبادئ تركز أساسًا على السلامة والتشغيل الأخلاقي.

قراءة مقترحة

30-09-2025
أحدث ثورة الذكاء الاصطناعي من Microsoft في إنشاء المستندات في Word و Excel
تعمل ميزة "وضع الوكيل" الجديدة المدعومة بالذكاء الاصطناعي من Microsoft في Word و Excel على تبسيط إنشاء المستندات، مما يسمح للمستخدمين بإنشاء محتوى احترافي باستخدام مطالبات اللغة الطبيعية.
ADVERTISEMENT
22-05-2025
اختيار 20 شركة فضاء جديدة من قبل المفوضية الأوروبية لتسريع الأعمال
اختيار 20 شركة فضاء جديدة من قبل المفوضية الأوروبية لتسريع الأعمال، ضمن برنامج CASSINI لدعم الابتكار والنمو في قطاع الفضاء.
26-08-2025
جوجل تشدد أمن تطبيقات أندرويد، وتلزم المطورين بالتحقق
تعزز جوجل أمان أندرويد من خلال طلب التحقق من مطوري التطبيقات لجميع عمليات التثبيت، مقتفية بذلك أثر أبل. تعرف على التغييرات والجدول الزمني.
23-09-2025
مهمة أرتميس القمرية التابعة لناسا تواجه تأخيرًا محتملاً لسنوات طويلة بسبب مشاكل في مركبة الهبوط ستارلاينر
تواجه مهمة أرتميس القمرية التابعة لناسا تأخيرًا محتملاً لسنوات بسبب تحديات تطوير مركبة الهبوط القمرية ستارلاينر التابعة لسبيس إكس، وفقًا للجنة سلامة تابعة لناسا.
ADVERTISEMENT
14-08-2025
سلسلة Galaxy S24 تحصل على أول تجربة لـ One UI 8.0 التجريبية مع أندرويد 16
سامسونج تطلق تحديث One UI 8.0 التجريبي لسلسلة Galaxy S24، جالبًا معه ميزات أندرويد 16، وتحسينات واجهة المستخدم، وأمانًا محسّنًا.
13-11-2025
البشرية على وشك تسجيل انبعاثات قياسية لثاني أكسيد الكربون في عام 2025، يكشف تقرير الميزانية الكربونية العالمية
من المتوقع أن تصل انبعاثات ثاني أكسيد الكربون العالمية إلى مستوى قياسي مرتفع في عام 2025، وفقًا لتقرير جديد. تعرف على النتائج الرئيسية والتحديات وومضات الأمل في المعركة ضد تغير المناخ.
25-11-2025
ون بلس تكشف عن هاتف وجهاز لوحي وساعة جديدة قبل موسم الأعياد
تعلن ون بلس عن الإطلاق الوشيك لهاتف OnePlus 15R وجهاز OnePlus Pad Go 2 اللوحي وساعة OnePlus Watch Lite في 17 ديسمبر، مقدمة خيارات جديدة بأسعار معقولة قبل العطلات.
ADVERTISEMENT
20-05-2025
اكتشافات مذهلة: رؤية "أشعة حلقات" زحل عبر تلسكوب هابل
اكتشف ظاهرة "أشعة حلقات" زحل من خلال فيديو مذهل تم التقاطه بواسطة تلسكوب هابل، والذي يعرض الديناميكيات المعقدة في حلقات الكوكب العملاق.
20-11-2025
اختبار يوتيوب للرسائل المباشرة: نظرة مقارنة على الميزات والتأثيرات الرئيسية
يختبر يوتيوب عودة الرسائل المباشرة، مما يحسن مشاركة المحتوى والمحادثات الخاصة لمضاهاة منصات المنافسين. إليك نظرة عامة مقارنة موجزة.
07-11-2025
خصم هائل على EcoFlow River 2 Pro: احصل على طاقة 1800 واط و 11 مخرج بسعر لا يصدق
اكتشف الصفقة المذهلة على محطة الطاقة المحمولة EcoFlow River 2 Pro، المتوفرة الآن بسعر مخفض بشكل كبير. تعرف على سعتها البالغة 1800 واط، و11 مخرجًا، والشحن السريع، وبطارية LFP المتينة.
ADVERTISEMENT