يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

·

19/08/2025

ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

يمكن لـ Claude AI الآن إنهاء المحادثات الضارة أو المسيئة بشكل مستمر.
هذه الميزة هي إجراء أمان تجريبي لنماذج Claude Opus 4 و 4.1.
الذكاء الاصطناعي مبرمج لقطع الحوارات بعد طلبات ضارة متكررة ومحاولات فاشلة لإعادة التوجيه.
هذه الخطوة جزء من مبادرة أنثروبيك "رفاهية النموذج"، التي تركز على حماية أنظمة الذكاء الاصطناعي.
يُطلب من الذكاء الاصطناعي عدم إنهاء المحادثات في حالات الخطر الوشيك لإيذاء النفس أو إيذاء الآخرين.

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

وضع الفأرة في Switch 2 يتألق في Drag x Drive

Drag x Drive لجهاز سويتش 2 تستعرض ضوابط وضع الفأرة المبهرة، مقدمةً تجربة فريدة لكرة السلة على الكراسي المتحركة مع ردود فعل لمسية وآليات لعب عميقة.

ADVERTISEMENT

Apple تستعد للكشف عن iPhone 17 و iPhone Air فائق النحافة في فعالية الأجهزة في سبتمبر

حدث أجهزة آبل لعام 2025 المقرر عقده في 9 سبتمبر من المتوقع أن يكشف عن سلسلة آيفون 17، وآيفون إير فائق النحافة، وساعات آبل الجديدة بالكامل، وإيربودز برو 3، بتصاميم جديدة جريئة وميزات متقدمة.

واتساب يتبنى الإعلانات المدعومة بالذكاء الاصطناعي: حقبة جديدة لعملاق المراسلة

يقدم واتساب إعلانات مدعومة بالذكاء الاصطناعي إلى منصته، تظهر في اقتراحات الحالة والقنوات، مما يمثل تحولًا كبيرًا في استراتيجية تحقيق الدخل الخاصة به.

DJI تكشف عن نظام الميكروفون اللاسلكي مايك 3، متوفر الآن

دي جيه آي تطلق نظام الميكروفون اللاسلكي الجديد DJI Mic 3، الذي يقدم ميزات صوت احترافية، ومدى ممتد، وقابلية توسعة معيارية لمبدعي المحتوى وصناع الأفلام. متوفر الآن.

ADVERTISEMENT

الذكاء الاصطناعي من جوجل يترجم صوتك في الوقت الفعلي، ويقوم بتزييف عميق لخطابك عبر اللغات

جوجل تكشف عن ميزة ترجمة فورية ثورية تستخدم الذكاء الاصطناعي لتزييف صوتك، مما يعزز التواصل متعدد اللغات بسرعة ودقة مبهرة.

لقد حصل هاتف Android الخاص بك للتو على ترقية Gemini رئيسية لمحبي الموسيقى

اكتشف كيف حصل مساعد جوجل Gemini AI على هواتف أندرويد على ترقية رئيسية ومجانية لمحبي الموسيقى، مما يتيح التعرف السهل على الأغاني عن طريق الاستماع أو الدندنة.

ذكاء جوجل الاصطناعي يعلن بالخطأ أن وكالة DOGE التابعة لإيلون ماسك وهمية

وصفت الذكاء الاصطناعي من جوجل وكالة DOGE التابعة لإيلون ماسك بأنها وهمية عن طريق الخطأ، مما أثار الارتباك ودفع عملاق التكنولوجيا إلى الاعتراف بالخطأ.

ADVERTISEMENT

انطلق بجرأة: إطلاق العرض الدعائي للموسم الثالث من 'ستار تريك: عوالم جديدة غريبة'

اكتشف أحدث مقطع دعائي للموسم الثالث من 'ستار تريك: عوالم جديدة غريبة'، والذي يكشف عن مغامرات جديدة وعناوين الحلقات وتواريخ الإصدار للعودة المرتقبة لطاقم يو.إس.إس. إنتربرايز.

تصميم "الزجاج السائل" من آبل: هل هو ممل لأجهزة الماك؟

يقدم الإصدار التجريبي العام لنظام macOS Tahoe من Apple تصميم "الزجاج السائل"، لكن المراجعات المبكرة تشير إلى أنه تحديث مخيب للآمال لأجهزة Mac، مع مشاعر متباينة حول تأثيره البصري ووظيفته.

واجهة كبسولة H2L: تحكم في الروبوتات الشبيهة بالبشر من كرسي مريح

اكتشف واجهة الكبسولة المبتكرة من H2L، والتي تتيح للمستخدمين التحكم في الروبوتات الشبيهة بالبشر بحركات العضلات من كرسي، مما يحدث ثورة في العمل عن بعد والرعاية الصحية والمزيد.

ADVERTISEMENT

آبل تدخل عالم النظارات الذكية: وداعًا للهواتف المحمولة كما نعرفها

آبل تستعد لإطلاق نظارات ذكية جديدة مزودة بالذكاء الاصطناعي وكاميرات مدمجة، مما قد يغير مفهوم الهواتف المحمولة كما نعرفها.

محمصة الخبز الذكية بسعر 400 دولار: أداة مطبخ عالية التقنية قد تسبب لك مغصًا

استكشف محمصة ريفوليوشن R180 كونكت بلس الذكية، وهي أداة مطبخ بقيمة 400 دولار أمريكي مزودة بشاشة لمس وإعدادات متقدمة، واكتشف ما إذا كانت تستحق كل هذا الضجيج.

جيميل تحت الحصار: قراصنة يستغلون التنبيهات الأمنية لسرقة حسابات المستخدمين

تُصدر جوجل تحذيرًا حاسمًا بشأن تصاعد محاولات اختراق حسابات Gmail. تعرّف على كيفية استخدام مجرمي الإنترنت لتنبيهات أمنية مزيفة لسرقة بيانات اعتماد تسجيل الدخول الخاصة بك وكيفية حماية حسابك.

ADVERTISEMENT

عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي

تحذر OpenAI و Google DeepMind و Anthropic من أن شفافية الذكاء الاصطناعي الحالية عبر التفكير المتسلسل قد تختفي، وتحث على تعاون الصناعة للحفاظ على قدرات المراقبة.

حدث أبل "المذهل" في سبتمبر: إشاعات عن آيفون 17 وإيربودز برو 3

تؤكد أبل حدث إطلاقها المذهل في سبتمبر، مع توقع أن تكون سلسلة آيفون 17 هي الحدث الأبرز. من المتوقع أيضًا الكشف عن إيربودز برو 3 ونماذج جديدة من ساعة أبل.

تصحيح المفاهيم: نهاية الكون ليست وشيكة كما يُشاع

تدحض الأبحاث الجديدة الادعاءات بأن الكون سينتهي قريبًا، موضحة أن الكيانات الأساسية ستظل مستقرة لفترة طويلة.

ADVERTISEMENT