يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

14-08-2025
وضع الفأرة في Switch 2 يتألق في Drag x Drive
Drag x Drive لجهاز سويتش 2 تستعرض ضوابط وضع الفأرة المبهرة، مقدمةً تجربة فريدة لكرة السلة على الكراسي المتحركة مع ردود فعل لمسية وآليات لعب عميقة.
ADVERTISEMENT
05-09-2025
Apple تستعد للكشف عن iPhone 17 و iPhone Air فائق النحافة في فعالية الأجهزة في سبتمبر
حدث أجهزة آبل لعام 2025 المقرر عقده في 9 سبتمبر من المتوقع أن يكشف عن سلسلة آيفون 17، وآيفون إير فائق النحافة، وساعات آبل الجديدة بالكامل، وإيربودز برو 3، بتصاميم جديدة جريئة وميزات متقدمة.
17-06-2025
واتساب يتبنى الإعلانات المدعومة بالذكاء الاصطناعي: حقبة جديدة لعملاق المراسلة
يقدم واتساب إعلانات مدعومة بالذكاء الاصطناعي إلى منصته، تظهر في اقتراحات الحالة والقنوات، مما يمثل تحولًا كبيرًا في استراتيجية تحقيق الدخل الخاصة به.
29-08-2025
DJI تكشف عن نظام الميكروفون اللاسلكي مايك 3، متوفر الآن
دي جيه آي تطلق نظام الميكروفون اللاسلكي الجديد DJI Mic 3، الذي يقدم ميزات صوت احترافية، ومدى ممتد، وقابلية توسعة معيارية لمبدعي المحتوى وصناع الأفلام. متوفر الآن.
ADVERTISEMENT
21-08-2025
الذكاء الاصطناعي من جوجل يترجم صوتك في الوقت الفعلي، ويقوم بتزييف عميق لخطابك عبر اللغات
جوجل تكشف عن ميزة ترجمة فورية ثورية تستخدم الذكاء الاصطناعي لتزييف صوتك، مما يعزز التواصل متعدد اللغات بسرعة ودقة مبهرة.
24-06-2025
لقد حصل هاتف Android الخاص بك للتو على ترقية Gemini رئيسية لمحبي الموسيقى
اكتشف كيف حصل مساعد جوجل Gemini AI على هواتف أندرويد على ترقية رئيسية ومجانية لمحبي الموسيقى، مما يتيح التعرف السهل على الأغاني عن طريق الاستماع أو الدندنة.
11-09-2025
ذكاء جوجل الاصطناعي يعلن بالخطأ أن وكالة DOGE التابعة لإيلون ماسك وهمية
وصفت الذكاء الاصطناعي من جوجل وكالة DOGE التابعة لإيلون ماسك بأنها وهمية عن طريق الخطأ، مما أثار الارتباك ودفع عملاق التكنولوجيا إلى الاعتراف بالخطأ.
ADVERTISEMENT
09-06-2025
انطلق بجرأة: إطلاق العرض الدعائي للموسم الثالث من 'ستار تريك: عوالم جديدة غريبة'
اكتشف أحدث مقطع دعائي للموسم الثالث من 'ستار تريك: عوالم جديدة غريبة'، والذي يكشف عن مغامرات جديدة وعناوين الحلقات وتواريخ الإصدار للعودة المرتقبة لطاقم يو.إس.إس. إنتربرايز.
25-07-2025
تصميم "الزجاج السائل" من آبل: هل هو ممل لأجهزة الماك؟
يقدم الإصدار التجريبي العام لنظام macOS Tahoe من Apple تصميم "الزجاج السائل"، لكن المراجعات المبكرة تشير إلى أنه تحديث مخيب للآمال لأجهزة Mac، مع مشاعر متباينة حول تأثيره البصري ووظيفته.
03-07-2025
واجهة كبسولة H2L: تحكم في الروبوتات الشبيهة بالبشر من كرسي مريح
اكتشف واجهة الكبسولة المبتكرة من H2L، والتي تتيح للمستخدمين التحكم في الروبوتات الشبيهة بالبشر بحركات العضلات من كرسي، مما يحدث ثورة في العمل عن بعد والرعاية الصحية والمزيد.
ADVERTISEMENT
27-05-2025
آبل تدخل عالم النظارات الذكية: وداعًا للهواتف المحمولة كما نعرفها
آبل تستعد لإطلاق نظارات ذكية جديدة مزودة بالذكاء الاصطناعي وكاميرات مدمجة، مما قد يغير مفهوم الهواتف المحمولة كما نعرفها.
09-09-2025
محمصة الخبز الذكية بسعر 400 دولار: أداة مطبخ عالية التقنية قد تسبب لك مغصًا
استكشف محمصة ريفوليوشن R180 كونكت بلس الذكية، وهي أداة مطبخ بقيمة 400 دولار أمريكي مزودة بشاشة لمس وإعدادات متقدمة، واكتشف ما إذا كانت تستحق كل هذا الضجيج.
18-08-2025
جيميل تحت الحصار: قراصنة يستغلون التنبيهات الأمنية لسرقة حسابات المستخدمين
تُصدر جوجل تحذيرًا حاسمًا بشأن تصاعد محاولات اختراق حسابات Gmail. تعرّف على كيفية استخدام مجرمي الإنترنت لتنبيهات أمنية مزيفة لسرقة بيانات اعتماد تسجيل الدخول الخاصة بك وكيفية حماية حسابك.
ADVERTISEMENT
16-07-2025
عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي
تحذر OpenAI و Google DeepMind و Anthropic من أن شفافية الذكاء الاصطناعي الحالية عبر التفكير المتسلسل قد تختفي، وتحث على تعاون الصناعة للحفاظ على قدرات المراقبة.
27-08-2025
حدث أبل "المذهل" في سبتمبر: إشاعات عن آيفون 17 وإيربودز برو 3
تؤكد أبل حدث إطلاقها المذهل في سبتمبر، مع توقع أن تكون سلسلة آيفون 17 هي الحدث الأبرز. من المتوقع أيضًا الكشف عن إيربودز برو 3 ونماذج جديدة من ساعة أبل.
20-05-2025
تصحيح المفاهيم: نهاية الكون ليست وشيكة كما يُشاع
تدحض الأبحاث الجديدة الادعاءات بأن الكون سينتهي قريبًا، موضحة أن الكيانات الأساسية ستظل مستقرة لفترة طويلة.
ADVERTISEMENT