يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

11-09-2025
طحالب القطب الشمالي تتحدى التوقعات: اكتشاف ميكروبات صغيرة تتحرك بنشاط داخل الجليد
اكتشف كيف أن الدياتومات الجليدية في القطب الشمالي تتمتع بقدرة مدهشة على الحركة، حيث تتحرك بنشاط داخل الجليد في درجات حرارة قصوى، مما يتحدى الافتراضات العلمية ويكشف عن أهمية بيئية محتملة.
ADVERTISEMENT
19-06-2025
HONOR تدخل عالم الروبوتات، محطمة الرقم القياسي لسرعة الروبوتات الشبيهة بالبشر بفضل الذكاء الاصطناعي
HONOR يحطم الرقم القياسي لسرعة الروبوتات الشبيهة بالبشر، حيث يصل إلى 4 أمتار في الثانية، مدعومًا بخوارزميات الذكاء الاصطناعي الخاصة به، مما يمثل دخولًا مهمًا في مجال الروبوتات.
10-09-2025
ميزات Apple Watch الصحية تتوسع لتشمل الطرازات القديمة
تعلن آبل أن ميزات تتبع الصحة الرئيسية، بما في ذلك إشعارات ارتفاع ضغط الدم ونتيجة النوم، ستكون متاحة على طرازات Apple Watch الأقدم مع تحديث watchOS 26 القادم.
01-07-2025
أوبن إيه آي توقف العمليات لمدة أسبوع وسط نزيف المواهب إلى ميتا
أفادت التقارير أن OpenAI أغلقت أبوابها لمدة أسبوع، مما أجبر الموظفين على الراحة وسط نزوح المواهب إلى Meta، مما يسلط الضوء على التكلفة البشرية الباهظة لسباق التسلح في مجال الذكاء الاصطناعي.
ADVERTISEMENT
03-06-2025
الصين تقود سباق الروبوتات البشرية: هل يخشى إيلون ماسك الهيمنة؟
تتسابق الشركات الناشئة في الصين لتطوير روبوتات بشرية تعمل بالذكاء الاصطناعي، مما يثير قلق إيلون ماسك بشأن هيمنة الصين المتزايدة في هذا المجال.
28-09-2025
ميتا تهدف إلى تشغيل روبوتات بشرية مستقبلية ببرمجياتها
تهدف ميتا إلى أن تصبح العمود الفقري البرمجي للروبوتات البشرية المستقبلية، مع التركيز على ترخيص تقنيتها لمصنعي الأجهزة بدلاً من إنتاج الروبوتات بنفسها. تستثمر الشركة بكثافة في أبحاث الذكاء الاصطناعي والروبوتات للتغلب على التحديات الرئيسية في البراعة والتلاعب.
05-08-2025
تطلق راوند هيل للاستثمارات صندوق ETF للروبوتات البشرية للانكشاف المستهدف
يناقش ديفيد مازا، الرئيس التنفيذي لشركة Roundhill Investments، إطلاق صندوق استثمار متداول (ETF) جديد يركز على الروبوتات البشرية، مما يوفر للمستثمرين انكشافًا على الشركات التي تسوّق هذه الآلات المتقدمة.
ADVERTISEMENT
30-05-2025
المملكة العربية السعودية: وادي السيليكون الجديد في الشرق الأوسط
تستثمر المملكة العربية السعودية 40 مليار دولار في الذكاء الاصطناعي لتصبح وادي السيليكون الجديد في الشرق الأوسط، مع التركيز على بناء البنية التحتية الرقمية، وجذب المواهب، وتحويل القطاعات التقليدية، وخلق فرص عمل جديدة ضمن رؤية 2030.
11-08-2025
الإمارات تتصدر التصنيفات الرقمية العالمية بأسرع إنترنت محمول وريادة الذكاء الاصطناعي
استكشف كيف تتصدر الإمارات العربية المتحدة التصنيفات الرقمية العالمية بأسرع إنترنت محمول في العالم وريادتها في مجال الذكاء الاصطناعي، مما يعرض التزامها بالابتكار التكنولوجي وتطوير المدن الذكية.
10-12-2025
ريديت تعزز إجراءات السلامة عالميًا للامتثال لقانون العمر الأسترالي
يطبق ريديت ميزات جديدة للتحقق من العمر والسلامة عالميًا للامتثال لقانون وسائل التواصل الاجتماعي الأسترالي، مع انتقاد نطاق التشريع.
ADVERTISEMENT