يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

10-02-2026
آبل تستكشف سماعات AirPods المزودة بكاميرا لمستقبل صوتي أذكى
استكشف مستقبل سماعات Apple AirPods Pro. تشير تقارير المحللين والتسريبات إلى دمج الكاميرا، والتحكم بالإيماءات، وطبقة منتج جديدة متميزة في الأفق.
ADVERTISEMENT
14-02-2026
تطور النظارات الذكية: الاتجاهات الرئيسية في الذكاء الاصطناعي القابل للارتداء
استكشف أهم الاتجاهات التي تشكل مستقبل النظارات الذكية، بدءًا من التعرف المدمج على الوجوه والذكاء الاصطناعي دائم التشغيل وصولًا إلى تحديات الخصوصية الملحة التي تطرحها.
12-09-2025
UBtech تؤمن صفقة كبرى بقيمة 35 مليون دولار للروبوتات البشرية الصناعية
حصلت شركة الروبوتات الصينية UBtech على طلب بقيمة 35 مليون دولار لروبوتاتها البشرية الصناعية، مما يشير إلى تقدم كبير في أتمتة التصنيع وتأثير الشركة المتزايد في قطاع الروبوتات العالمي.
11-08-2025
سر أندرويد 17 اللذيذ: الاسم الرمزي الداخلي لجوجل تسرب باسم "لفافة القرفة"
أفادت التقارير أن الاسم الرمزي الداخلي لشركة جوجل لنظام أندرويد 17 قد تم الكشف عنه باسم "سينامون بان"، استمرارًا لتقليد الشركة في التسميات الداخلية المستوحاة من الحلويات.
ADVERTISEMENT
18-07-2025
الأجهزة الذكية تمكن كبار السن من التقدم في العمر في المنزل، حسبما وجد استطلاع
يكشف استطلاع جديد أن الأجهزة الذكية التي تعمل بالذكاء الاصطناعي تساعد كبار السن على التقدم في العمر في المنزل، ولكن الشكوك حول المعلومات التي يتم إنشاؤها بواسطة الذكاء الاصطناعي لا تزال قائمة.
13-11-2025
أطلقت OpenAI نموذج GPT-5.1: ذكاء اصطناعي أكثر ذكاءً ومحادثة لـ ChatGPT
تطلق OpenAI GPT-5.1، وهو تحديث لـ ChatGPT يعد بتجربة "أكثر دفئًا وذكاءً". اكتشف التحسينات التقنية الرئيسية لنماذجي Instant و Thinking، بما في ذلك اتباع التعليمات بشكل أفضل وضوابط شخصية جديدة.
22-12-2025
تحليل مقارن: ثندربيرد ماكس سبيس مقابل محطات الفضاء التقليدية متعددة الوحدات
تتيح محطة ثندربيرد الفضائية لماكس سبيس بناء موطن مداري بإطلاق واحد، مما يتناقض مع التصاميم التقليدية متعددة الوحدات من حيث الكفاءة والمرونة والأداء.
ADVERTISEMENT
21-05-2025
جوجل تبدأ في دمج روبوت الدردشة الذكي في محرك البحث
جوجل تعلن عن دمج روبوت الدردشة الذكي في محرك البحث، مما يتيح تجربة محادثة أكثر تعقيدًا للمستخدمين، مع خطط لتطوير نظارات ذكية جديدة.
21-10-2025
روبوتات عميقة تكشف عن روبوت بشري قوي للبيئات الصعبة
تقدم شركة Deep Robotics الصينية الروبوت DR02، وهو روبوت شبيه بالبشر "مقاوم لجميع الأحوال الجوية" بتصنيف IP66 لتعزيز المتانة في المطر والغبار، مما يوسع التطبيقات المحتملة.
28-10-2025
تسريبات ميزات بيكسل تشير إلى ترقيات كبيرة في التخصيص والذكاء الاصطناعي
استكشف التفاصيل المسربة لـ Google Pixel Feature Drop القادم، والتي تكشف عن حزم سمات جديدة، وإنشاء صور GIF مدعومة بالذكاء الاصطناعي، وميزات Pixel VIP محسّنة لهواتف Pixel.
ADVERTISEMENT