يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

15-08-2025
بكتيريا آكلة للحوم تصيب سباحًا في شاطئ فالموث
أصيب سباح في فالماوث، ماساتشوستس، ببكتيريا آكلة للحوم، وهي بكتيريا الضمة اللاهوائية (Vibrio vulnificus)، بعد السباحة في شاطئ أولد سيلفر. تعرف على المخاطر والوقاية.
ADVERTISEMENT
26-05-2025
هل يمكن للذكاء الاصطناعي حل أزمة الغذاء العالمية القادمة؟
تستعرض المقالة كيف يمكن للذكاء الاصطناعي أن يسهم في حل أزمة الغذاء العالمية المتزايدة بحلول عام 2050، مع التركيز على أهمية التعاون بين التخصصات.
13-08-2025
ماسك يتهم أبل بالتلاعب بمتجر التطبيقات لصالح ChatGPT، ويهدد باتخاذ إجراءات قانونية
إيلون ماسك يتهم شركة أبل بانتهاكات مكافحة الاحتكار، زاعمًا أن متجر التطبيقات يروّج بشكل غير عادل لتشات جي بي تي على حساب روبوته الدردشة المدعوم بالذكاء الاصطناعي، غروك، ويهدد باتخاذ إجراءات قانونية.
16-07-2025
عمالقة الذكاء الاصطناعي يتحدون لحماية الشفافية الزائلة في التفكير الآلي
تحذر OpenAI و Google DeepMind و Anthropic من أن شفافية الذكاء الاصطناعي الحالية عبر التفكير المتسلسل قد تختفي، وتحث على تعاون الصناعة للحفاظ على قدرات المراقبة.
ADVERTISEMENT
10-07-2025
تستعين شركة Diligent Robotics بمديري تنفيذيين من Cruise لتوسع كبير يتجاوز مجال الرعاية الصحية
شركة Diligent Robotics الناشئة في مجال الروبوتات الشبيهة بالبشر توظف مسؤولين تنفيذيين سابقين في Cruise لتوسيع روبوت Moxi الخاص بها خارج نطاق الرعاية الصحية إلى تطبيقات تجارية أوسع، بهدف الوصول إلى 3000 عملية نشر بحلول عام 2030.
15-07-2025
عشرات من "المجرات الشبحية" قد تدور حول درب التبانة، كما يشتبه علماء الفلك
تشير أبحاث جديدة إلى أن العشرات من "المجرات الشبحية" قد تدور حول مجرة درب التبانة، مما قد يحل لغزًا طال أمده في علم الكونيات ويعزز نظرية المادة المظلمة الباردة لامدا.
20-05-2025
إنتل تكشف عن بطاقات الرسوميات Arc Pro B50 وB60 في Computex 2025
إنتل تكشف عن بطاقات الرسوميات Arc Pro B50 وB60 في Computex 2025، مع التركيز على الأداء والذاكرة العالية في سوق الرسوميات الاحترافية.
ADVERTISEMENT
10-09-2025
أتاري تُعيد إحياء ألعاب الريترو مع جهازها المحمول الجديد "جيم ستيشن جو" بسعر 180 دولارًا
أتاري تقبل الآن الطلبات المسبقة لجهازها الجديد Gamestation Go المحمول، الذي يضم 200 لعبة كلاسيكية مدمجة، وشاشة بحجم 7 بوصات، وخيارات اتصال حديثة.
18-07-2025
أطلقت OpenAI وكيل ChatGPT: مساعدك المستقل الجديد للكمبيوتر
تقدم OpenAI وكيل ChatGPT، وهو أداة ذكاء اصطناعي مصممة للتحكم بشكل مستقل في جهاز الكمبيوتر الخاص بك لإنجاز مهام معقدة. تعرف على كيفية عمل هذا الذكاء الاصطناعي الوكيلي الجديد وقدراته وتوافره.
21-07-2025
أوبر وبايدو تطلقان سيارات الأجرة الروبوتية في آسيا والشرق الأوسط
أوبر وبايدو تطلقان خدمات سيارات الأجرة الروبوتية في آسيا والشرق الأوسط، مما يمثل توسعًا عالميًا كبيرًا للمركبات ذاتية القيادة والتنقل الحضري.
ADVERTISEMENT
15-08-2025
تين إيدج إنجينيرينغ توزع علبة كمبيوتر بلاستيكية مجانية
تُطلق تينج إنجينيرينج كمبيوتر-2، علبة حاسوب مجانية قابلة للطي مصنوعة من البلاستيك، مصممة لتجميعات mini-ITX.
27-08-2025
حدث أبل "المذهل" في سبتمبر: إشاعات عن آيفون 17 وإيربودز برو 3
تؤكد أبل حدث إطلاقها المذهل في سبتمبر، مع توقع أن تكون سلسلة آيفون 17 هي الحدث الأبرز. من المتوقع أيضًا الكشف عن إيربودز برو 3 ونماذج جديدة من ساعة أبل.
29-07-2025
بلندر ينطلق: تطبيق 3D الشهير يحصل على نسخة مخصصة للأجهزة اللوحية
برنامج بلندر، حزمة إنشاء المحتوى ثلاثي الأبعاد مفتوحة المصدر الشهيرة، يطور نسخة مخصصة للأجهزة اللوحية، بهدف جلب أدوات النمذجة والتحريك ثلاثية الأبعاد القوية إلى واجهة محمولة وسهلة الاستخدام باللمس. يركز التطوير الأولي على iPad Pro و Apple Pencil، مع عرض تقني مخطط له في SIGGRAPH 2025.
ADVERTISEMENT
07-08-2025
سبوتيفاي يرفع أسعار الاشتراك المميز عالمياً، المستخدمون في الولايات المتحدة ينتظرون الخطوة التالية
سبوتيفاي ترفع أسعار اشتراكاتها المميزة (بريميوم) في العديد من الأسواق العالمية، على الرغم من أن الأسعار في الولايات المتحدة لا تزال دون تغيير في الوقت الحالي. استكشف الأسباب وراء هذه الزيادة وتأثيرها المحتمل على الفنانين وصناعة البث الموسيقي (الستريمينغ).
18-07-2025
خدمة Starlink من T-Mobile: سد فجوة الاتصال
سيتم إطلاق خدمة T-Satellite المدعومة من Starlink التابعة لـ T-Mobile الأسبوع المقبل، وستقدم خدمة الرسائل المباشرة إلى الهاتف المحمول للقضاء على المناطق الميتة لعملاء T-Mobile و AT&T و Verizon.
09-07-2025
إحداث ثورة في الأيدي الروبوتية: قوة دوائر اللمس المتفوقة المتكاملة
استكشف كيف تحدث دارات اللمس المتفوقة ثورة في أيدي الروبوتات الشبيهة بالبشر، مما يتيح براعة على مستوى الإنسان ومعالجة نقص العمالة في مختلف الصناعات.
ADVERTISEMENT