يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

06-04-2026
الروبوتات البشرية الصينية تتقدم نحو التسويق التجاري
استكشف التسويق التجاري السريع لصناعة الروبوتات البشرية في الصين، مدفوعًا بالخوارزميات المتقدمة، والتعلم بالمحاكاة، وطرق التدريب القائمة على البيانات.
ADVERTISEMENT
07-04-2026
آيفون قابل للطي من آبل: اتجاه تصميمي جديد يظهر
تشير التسريبات الأخيرة إلى تصميم محسّن لهاتف آبل القابل للطي الذي يُشاع عنه، ويتميز ببروز كاميرا أصغر ومظهر جديد مقارنة بالنماذج الأولية السابقة.
07-04-2026
آيفون قابل للطي من آبل يدخل مرحلة الإنتاج التجريبي الحاسمة قبل ظهوره في 2026
دخل هاتف آبل القابل للطي، آيفون فولد، مرحلة الإنتاج التجريبي في فوكسكون، مع تخطيط الإنتاج الضخم لشهر يوليو. من المتوقع إطلاق الجهاز في عام 2026 بتصميم فريد قابل للطي وتنازلات محددة في الميزات.
07-04-2026
التنقل في ثورة الذكاء الاصطناعي: مقترحات سياسات OpenAI
اقترحت OpenAI عقدًا اجتماعيًا جديدًا لعصر الذكاء الخارق. استكشف أفكارهم السياسية الرئيسية، من صناديق الثروة العامة وأسابيع العمل لمدة 4 أيام إلى إصلاح الضرائب.
ADVERTISEMENT
08-04-2026
شاشة سوني RGB الحقيقية منافس جديد في أجهزة التلفزيون المتطورة
نظرة معمقة على تقنية سوني الجديدة True RGB Mini LED. اكتشف كيف يعمل نظام الإضاءة الخلفية المبتكر لديها مقارنةً بـ Bravia 9 وأجهزة التلفزيون المنافسة وشاشات OLED.
09-04-2026
ميوز سبارك للذكاء الاصطناعي من ميتا تهدف إلى إعادة تشكيل المشهد التنافسي
استكشف الذكاء الاصطناعي الجديد من ميتا، ميوز سبارك. تعرف على قدراته في الاستدلال متعدد الوسائط، والتكامل العميق مع المنتجات، واستراتيجيات تحقيق الدخل مع منافسته لشركتي أوبن إيه آي وجوجل.
09-04-2026
التنقل في مستقبل التكنولوجيا القابل للتصرف: دروس من كيندل
قرار أمازون بإنهاء الدعم لأجهزة كيندل القديمة يسلط الضوء على اتجاهات تقنية رئيسية مثل التقادم المخطط له، وزيادة النفايات الإلكترونية، والبحث عن بدائل مفتوحة.
ADVERTISEMENT
10-04-2026
آبل تعالج مشكلة الاتصال بالشبكة في macOS Tahoe 26.4.1
أصدرت Apple نظام macOS Tahoe 26.4.1، وهو تحديث بسيط يركز على إصلاح خطأ حرج في اتصال Wi-Fi لطرازات MacBook M5. تعرف على الإصلاح.
10-04-2026
الذكاء الاصطناعي يدخل ساحة الأمن السيبراني: سباق تسلح جديد
استكشف سباق التسلح الناشئ في مجال الذكاء الاصطناعي في الأمن السيبراني. اكتشف كيف تقوم شركات مثل OpenAI و Anthropic بتطوير أدوات جديدة قوية لإحداث ثورة في الدفاع الرقمي.
13-04-2026
عودة مشغلات الموسيقى المخصصة في عصر البث المباشر
اكتشف لماذا تعود أجهزة iPod ومشغلات MP3 المخصصة. التكاليف المتزايدة للبث والرغبة في الملكية تدفعان إلى العودة للموسيقى غير المتصلة بالإنترنت.
ADVERTISEMENT