يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

17-06-2025
الروبوتات تدخل الحلبة: المقاتلون البشريون يعيدون تعريف الكيك بوكسينغ في مشهد تاريخي
اكتشف كيف تُحدث الروبوتات الشبيهة بالبشر ثورة في الرياضات القتالية في مباراة كيك بوكسينغ تاريخية في هانغتشو بالصين، حيث تمزج بين المهارة البشرية والذكاء الاصطناعي المتقدم.
ADVERTISEMENT
17-06-2025
وكالة ناسا توافق على مهمة خاصة لمحطة الفضاء الدولية بعد إصلاح تسرب الهواء
وكالة ناسا توافق على مهمة خاصة لمحطة الفضاء الدولية بعد إصلاحات ناجحة لتسرب الهواء في وحدة زفيزدا الروسية، مما يمهد الطريق لمهمة أكسيوم 4.
10-07-2025
تستعين شركة Diligent Robotics بمديري تنفيذيين من Cruise لتوسع كبير يتجاوز مجال الرعاية الصحية
شركة Diligent Robotics الناشئة في مجال الروبوتات الشبيهة بالبشر توظف مسؤولين تنفيذيين سابقين في Cruise لتوسيع روبوت Moxi الخاص بها خارج نطاق الرعاية الصحية إلى تطبيقات تجارية أوسع، بهدف الوصول إلى 3000 عملية نشر بحلول عام 2030.
27-06-2025
سكان توفالو يلتمسون اللجوء في أستراليا مع تهديد ارتفاع منسوب البحار لوطنهم
تعرف على نضال توفالو ضد ارتفاع منسوب مياه البحر وبرنامج أستراليا الرائد للتأشيرة المناخية الذي يوفر الملاذ لمواطنيها. اكتشف التحديات التي تواجهها هذه الدولة الجزرية وجهودها للحفاظ على هويتها.
ADVERTISEMENT
27-10-2025
الشكل 03: الروبوت البشري المدعوم بالذكاء الاصطناعي على وشك إعادة تشكيل العمل
الشكل 03: الروبوت البشري المدعوم بالذكاء الاصطناعي على وشك إعادة تشكيل العمل
05-08-2025
الأشعة الكونية قد تفتح آفاقًا جديدة في البحث عن الحياة الفضائية
نظرية جديدة تقترح أن الأشعة الكونية قد تمكّن الحياة في بيئات باردة ومظلمة بعيدًا عن النجوم، مما قد يوسع نطاق البحث عن الحياة خارج كوكب الأرض إلى ما وراء المنطقة التقليدية الصالحة للسكن.
05-09-2025
سوق معالجة المياه في الشرق الأوسط يتأهب للنمو وسط ندرة المياه والتحضر
استكشف سوق أنظمة معالجة المياه عند نقطة الدخول في الشرق الأوسط، والذي يُتوقع أن يصل إلى 1,161.1 مليون دولار أمريكي بحلول عام 2033، مدفوعًا بندرة المياه، والتوسع الحضري، والابتكار التكنولوجي.
ADVERTISEMENT
21-08-2025
جوجل قفزة مغناطيسية: بيكسل سناب يصل لسلسلة بيكسل 10
جوجل تكشف النقاب عن PixelSnap، نظامها الجديد للملحقات المغناطيسية لسلسلة Pixel 10، مما يوفر وظائف شبيهة بـ MagSafe مع الشواحن، والحوامل، والمزيد.
26-08-2025
تسريب جوجل نيست: فيديو بدقة 2K، ألوان جديدة، وميزات الذكاء الاصطناعي تلوح في الأفق
تسريب كاميرات وأجراس Nest من الجيل التالي من جوجل، يكشف عن فيديو بدقة 2K وألوان جديدة وميزات الذكاء الاصطناعي. اكتشف تغييرات الاشتراك المحتملة وتحديثات مكبرات الصوت Google Home.
03-10-2025
سوني تعزز سماعات الرأس والأذن الرائدة بميزة مشاركة الصوت والذكاء الاصطناعي والمزيد
تتلقى سماعات الرأس WH-1000XM6 وسماعات الأذن WF-1000XM5 من سوني تحديثات للبرامج الثابتة تضيف ميزات مشاركة الصوت والمساعدة بالذكاء الاصطناعي وصوت Bluetooth LE.
ADVERTISEMENT