يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

06-10-2025
هل يمكن أن يتم إطلاق بلايستيشن 6 بدون منافس؟ شائعات إكس بوكس تهز عالم الألعاب
تدور الشائعات بأن مايكروسوفت تعيد تقييم مستقبل إكس بوكس، مما يثير احتمال إطلاق بلايستيشن 6 دون منافسة مباشرة. ماذا يعني ذلك لمشهد أجهزة الألعاب؟
ADVERTISEMENT
17-10-2025
الروبوتات والذكاء الاصطناعي يُحدثان ثورة في تصنيع الزجاج والأبواب
استكشف كيف تُحدث الروبوتات والذكاء الاصطناعي ثورة في صناعات الزجاج والأبواب، مما يعزز الكفاءة والدقة ومستقبل العمل.
04-12-2025
تكامل محتمل بين Apple Health و ChatGPT لتقديم رؤى صحية مخصصة
استكشف إمكانية دمج Apple Health و ChatGPT، وما قد يعنيه ذلك للنصائح الصحية المخصصة، ومخاوف الخصوصية المرتبطة بها.
10-12-2025
مقارنة تقنيات القياسات الأوقيانوغرافية: عوامة آرجو والطرق التقليدية تحت جليد القارة القطبية الجنوبية
تكشف بيانات نادرة من عوامة أرجو تحت جليد القطب الجنوبي عن مزايا مقارنة بالسفن البحثية التقليدية، مما يعزز دراسات المناخ ومستوى سطح البحر في المناطق القاسية.
ADVERTISEMENT
13-10-2025
صعود الآلات: الروبوتات الشبيهة بالبشر تدخل أرض المصنع
استكشف التكامل المتزايد للروبوتات البشرية المدعومة بالذكاء الاصطناعي في أرضيات المصانع، وتأثيرها على كفاءة التصنيع، والسباق العالمي للهيمنة التكنولوجية.
03-12-2025
الاتجاهات الرئيسية في الساعات الذكية للياقة البدنية: صعود الأجهزة القابلة للارتداء التي تركز على الصحة
استكشف أهم اتجاهات الساعات الذكية للياقة البدنية لعام 2024، من المراقبة الصحية المتقدمة إلى الاتصال السلس، مع حالات واقعية مثل Fitbit Versa 4.
15-07-2025
رفض Gemini AI مباراة شطرنج مع أتاري بعد علمه بهزيمة ChatGPT
يرفض Gemini AI من Google لعب الشطرنج ضد Atari 2600 بعد أن علم أن ChatGPT و Copilot خسرا أمام وحدة التحكم القديمة، مما يسلط الضوء على ميل الذكاء الاصطناعي إلى المبالغة في الثقة و "الهلوسة".
ADVERTISEMENT
26-05-2025
الروبوت الجديد في التحضير للحرب الكيميائية: قفزة دفاعية جريئة من الولايات المتحدة
الولايات المتحدة تطلق نظام اختبار روبوتي جديد يُعرف باسم Porton Man لتعزيز قدرات الدفاع ضد التهديدات الكيميائية.
05-12-2025
الاتجاهات الرئيسية في سماعات الأذن اللاسلكية: رؤى من مراجعة Soundpeats Air5 Pro+
اكتشف أحدث الاتجاهات في سماعات الأذن اللاسلكية: مشغلات xMEMS، إلغاء الضوضاء النشط، تخصيص التطبيقات، وأبرز نقاط الأداء مقابل السعر من مراجعة Soundpeats Air5 Pro+.
03-12-2025
نماذج ميسترال ميسترال 3: مقارنة ابتكار الذكاء الاصطناعي مفتوح الوزن مع شركات التكنولوجيا الكبرى
نماذج ميسترال 3 الجديدة من ميسترال تنافس شركات التكنولوجيا الكبرى بقدرات مفتوحة الوزن ومتعددة الوسائط، وأداء محسّن، وتطبيقات واسعة للمؤسسات.
ADVERTISEMENT