يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

·

19/08/2025

ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

يمكن لـ Claude AI الآن إنهاء المحادثات الضارة أو المسيئة بشكل مستمر.
هذه الميزة هي إجراء أمان تجريبي لنماذج Claude Opus 4 و 4.1.
الذكاء الاصطناعي مبرمج لقطع الحوارات بعد طلبات ضارة متكررة ومحاولات فاشلة لإعادة التوجيه.
هذه الخطوة جزء من مبادرة أنثروبيك "رفاهية النموذج"، التي تركز على حماية أنظمة الذكاء الاصطناعي.
يُطلب من الذكاء الاصطناعي عدم إنهاء المحادثات في حالات الخطر الوشيك لإيذاء النفس أو إيذاء الآخرين.

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

بكتيريا آكلة للحوم تصيب سباحًا في شاطئ فالموث

أصيب سباح في فالماوث، ماساتشوستس، ببكتيريا آكلة للحوم، وهي بكتيريا الضمة اللاهوائية (Vibrio vulnificus)، بعد السباحة في شاطئ أولد سيلفر. تعرف على المخاطر والوقاية.

ADVERTISEMENT

هل يمكن للذكاء الاصطناعي حل أزمة الغذاء العالمية القادمة؟

تستعرض المقالة كيف يمكن للذكاء الاصطناعي أن يسهم في حل أزمة الغذاء العالمية المتزايدة بحلول عام 2050، مع التركيز على أهمية التعاون بين التخصصات.

ماسك يتهم أبل بالتلاعب بمتجر التطبيقات لصالح ChatGPT، ويهدد باتخاذ إجراءات قانونية

إيلون ماسك يتهم شركة أبل بانتهاكات مكافحة الاحتكار، زاعمًا أن متجر التطبيقات يروّج بشكل غير عادل لتشات جي بي تي على حساب روبوته الدردشة المدعوم بالذكاء الاصطناعي، غروك، ويهدد باتخاذ إجراءات قانونية.

عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي

تحذر OpenAI و Google DeepMind و Anthropic من أن شفافية الذكاء الاصطناعي الحالية عبر التفكير المتسلسل قد تختفي، وتحث على تعاون الصناعة للحفاظ على قدرات المراقبة.

ADVERTISEMENT

تستعين شركة Diligent Robotics بمديري تنفيذيين من Cruise لتوسع كبير يتجاوز مجال الرعاية الصحية

شركة Diligent Robotics الناشئة في مجال الروبوتات الشبيهة بالبشر توظف مسؤولين تنفيذيين سابقين في Cruise لتوسيع روبوت Moxi الخاص بها خارج نطاق الرعاية الصحية إلى تطبيقات تجارية أوسع، بهدف الوصول إلى 3000 عملية نشر بحلول عام 2030.

عشرات من "المجرات الشبحية" قد تدور حول درب التبانة، كما يشتبه علماء الفلك

تشير أبحاث جديدة إلى أن العشرات من "المجرات الشبحية" قد تدور حول مجرة درب التبانة، مما قد يحل لغزًا طال أمده في علم الكونيات ويعزز نظرية المادة المظلمة الباردة لامدا.

إنتل تكشف عن بطاقات الرسوميات Arc Pro B50 وB60 في Computex 2025

إنتل تكشف عن بطاقات الرسوميات Arc Pro B50 وB60 في Computex 2025، مع التركيز على الأداء والذاكرة العالية في سوق الرسوميات الاحترافية.

ADVERTISEMENT

أتاري تُعيد إحياء ألعاب الريترو مع جهازها المحمول الجديد "جيم ستيشن جو" بسعر 180 دولارًا

أتاري تقبل الآن الطلبات المسبقة لجهازها الجديد Gamestation Go المحمول، الذي يضم 200 لعبة كلاسيكية مدمجة، وشاشة بحجم 7 بوصات، وخيارات اتصال حديثة.

أطلقت OpenAI وكيل ChatGPT: مساعدك المستقل الجديد للكمبيوتر

تقدم OpenAI وكيل ChatGPT، وهو أداة ذكاء اصطناعي مصممة للتحكم بشكل مستقل في جهاز الكمبيوتر الخاص بك لإنجاز مهام معقدة. تعرف على كيفية عمل هذا الذكاء الاصطناعي الوكيلي الجديد وقدراته وتوافره.

أوبر وبايدو تطلقان سيارات الأجرة الروبوتية في آسيا والشرق الأوسط

أوبر وبايدو تطلقان خدمات سيارات الأجرة الروبوتية في آسيا والشرق الأوسط، مما يمثل توسعًا عالميًا كبيرًا للمركبات ذاتية القيادة والتنقل الحضري.

ADVERTISEMENT

تين إيدج إنجينيرينغ توزع علبة كمبيوتر بلاستيكية مجانية

تُطلق تينج إنجينيرينج كمبيوتر-2، علبة حاسوب مجانية قابلة للطي مصنوعة من البلاستيك، مصممة لتجميعات mini-ITX.

حدث أبل "المذهل" في سبتمبر: إشاعات عن آيفون 17 وإيربودز برو 3

تؤكد أبل حدث إطلاقها المذهل في سبتمبر، مع توقع أن تكون سلسلة آيفون 17 هي الحدث الأبرز. من المتوقع أيضًا الكشف عن إيربودز برو 3 ونماذج جديدة من ساعة أبل.

بلندر ينطلق: تطبيق 3D الشهير يحصل على نسخة مخصصة للأجهزة اللوحية

برنامج بلندر، حزمة إنشاء المحتوى ثلاثي الأبعاد مفتوحة المصدر الشهيرة، يطور نسخة مخصصة للأجهزة اللوحية، بهدف جلب أدوات النمذجة والتحريك ثلاثية الأبعاد القوية إلى واجهة محمولة وسهلة الاستخدام باللمس. يركز التطوير الأولي على iPad Pro و Apple Pencil، مع عرض تقني مخطط له في SIGGRAPH 2025.

ADVERTISEMENT

سبوتيفاي يرفع أسعار الاشتراك المميز عالمياً، المستخدمون في الولايات المتحدة ينتظرون الخطوة التالية

سبوتيفاي ترفع أسعار اشتراكاتها المميزة (بريميوم) في العديد من الأسواق العالمية، على الرغم من أن الأسعار في الولايات المتحدة لا تزال دون تغيير في الوقت الحالي. استكشف الأسباب وراء هذه الزيادة وتأثيرها المحتمل على الفنانين وصناعة البث الموسيقي (الستريمينغ).

خدمة Starlink من T-Mobile: سد فجوة الاتصال

سيتم إطلاق خدمة T-Satellite المدعومة من Starlink التابعة لـ T-Mobile الأسبوع المقبل، وستقدم خدمة الرسائل المباشرة إلى الهاتف المحمول للقضاء على المناطق الميتة لعملاء T-Mobile و AT&T و Verizon.

إحداث ثورة في الأيدي الروبوتية: قوة دوائر اللمس المتفوقة المتكاملة

استكشف كيف تحدث دارات اللمس المتفوقة ثورة في أيدي الروبوتات الشبيهة بالبشر، مما يتيح براعة على مستوى الإنسان ومعالجة نقص العمالة في مختلف الصناعات.

ADVERTISEMENT