يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

25-06-2025
غلوبانت تؤسس مقرها في الشرق الأوسط وسط ارتفاع الإيرادات
تفتتح جلوبانت مقرها الرئيسي في الشرق الأوسط، مما يشير إلى توسع استراتيجي وسط ارتفاع الإيرادات الإقليمية وتركيزها على سوق التكنولوجيا المزدهر.
ADVERTISEMENT
11-09-2025
تشيفتك بريسيجن تحول تطوير الروبوتات نحو الأنظمة المعيارية ما وراء الروبوتات الشبيهة بالبشر
تعلن Chieftek Precision عن توسع استراتيجي في تطوير الروبوتات المعيارية، متجاوزةً التصاميم الشبيهة بالبشر لإنشاء حلول روبوتية أكثر قابلية للتكيف وتنوعًا لتطبيقات صناعية متنوعة.
25-06-2025
محامو إيلون ماسك يدعون أنه لا يمتلك جهاز كمبيوتر، مما يثير الجدل في دعوى قضائية ضد OpenAI
يزعم محامو إيلون ماسك أنه لا يمتلك جهاز كمبيوتر في دعوى قضائية، مما يتناقض مع تصريحاته العلنية ويثير تساؤلات حول الدعوى القضائية المستمرة مع OpenAI.
09-12-2025
تأثير الذكاء الاصطناعي في مكان العمل: تقرير جديد من OpenAI يكشف عن وفورات متواضعة في الوقت
يكشف تقرير جديد من OpenAI أنه بينما يرتفع اعتماد الذكاء الاصطناعي في الشركات، فإن العامل العادي يوفر أقل من ساعة واحدة في اليوم، مما يسلط الضوء على فجوة بين المستخدمين المكثفين والمستخدمين العاديين.
ADVERTISEMENT
18-09-2025
آيفون 17 برو مقابل آيفون 15 برو: هل يستحق الترقية بعد عامين؟
استكشف الاختلافات الرئيسية بين iPhone 17 Pro و iPhone 15 Pro، مع تفصيل الترقيات في الشاشة والكاميرا والأداء والبطارية والتصميم لمساعدتك في تحديد ما إذا كانت الترقية لمدة عامين مناسبة لك.
13-06-2025
نموذج الذكاء الاصطناعي الجديد من ميتا يفهم الجاذبية: قفزة نحو آلات أكثر ذكاءً
نموذج الذكاء الاصطناعي الجديد من ميتا، V-JEPA 2، يفهم القواعد الفيزيائية مثل الجاذبية، مما يمهد الطريق لروبوتات وأنظمة ذاتية أكثر ذكاءً.
21-10-2025
طريقة إعادة تدوير ثورية تفتح العناصر الأرضية النادرة من النفايات الإلكترونية
اكتشف طريقة جديدة موفرة للطاقة لإعادة التدوير باستخدام التسخين بالوميض جول والكلور لاستخلاص العناصر الأرضية النادرة من مغناطيسات النفايات الإلكترونية، مما قد يعزز الإمدادات المحلية.
ADVERTISEMENT
24-06-2025
تطبيق Xbox للكمبيوتر يدمج الآن ألعاب Steam الخاصة بك
يتكامل تطبيق Xbox للكمبيوتر الشخصي الآن مع ألعاب Steam، بهدف أن يصبح مشغلًا عالميًا. تعكس هذه الخطوة استراتيجية Microsoft لتوسيع نظامها البيئي للألعاب عبر منصات الكمبيوتر الشخصي والأجهزة المحمولة والسحابة.
01-12-2025
تؤدي الانفجارات الشمسية إلى استدعاء ضخم لطائرة إيرباص A320: هل يمكن أن تتأثر رحلتك؟
اكتشف كيف قد تكون الانفجارات الشمسية قد أفسدت بيانات التحكم الحيوية في طائرات إيرباص A320، مما أدى إلى استدعاء ضخم واضطرابات محتملة في الرحلات الجوية.
14-10-2025
ساعة جالاكسي واتش 7 تحصل على قوة Wear OS 6 مع تحديث One UI 8
تتلقى سلسلة Galaxy Watch 7 من سامسونج الآن تحديث One UI 8 المستند إلى Wear OS 6، مما يجلب ميزات جديدة وتحسينات على الواجهة. تعرف على المزيد حول طرح التحديث وما يمكن توقعه.
ADVERTISEMENT