يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

04-01-2026
روبوت أوبتيموس من تسلا يتعثر في ظهوره العلني، مسلطًا الضوء على تحديات الصناعة
واجه روبوت أوبتيموس من تسلا فشلاً علنياً، مما سلط الضوء على التحديات في صناعة الروبوتات البشرية سريعة التطور والمنافسة العالمية الشديدة.
ADVERTISEMENT
10-07-2025
قبضة التكنولوجيا الجيوسياسية: كيف تشكل الولايات المتحدة الشرق الأوسط
استكشف كيف تستخدم الولايات المتحدة هيمنتها التكنولوجية للتأثير على ديناميكيات القوة العالمية، وخاصة في الشرق الأوسط، كما ناقش ذلك باريس ماركس ولاله خليلي.
26-06-2025
روبوتات Apptronik 'الخارقة': إعادة تعريف العمل الشاق
روبوتات أبترونيك 'الخارقة' تستعد لإحداث ثورة في الأعمال الشاقة، ودفع الأتمتة إلى ما وراء الحدود البشرية وتحويل الصناعات بقدرات متقدمة.
24-09-2025
الروبوتات الشبيهة بالبشر تستعد لإحداث ثورة في أحواض بناء السفن من خلال شراكة ABS و Persona AI
تتعاون ABS و Persona AI لدمج الروبوتات الشبيهة بالبشر في أحواض بناء السفن، بهدف تعزيز السلامة والإنتاجية من خلال معايير جديدة وتقنيات متقدمة.
ADVERTISEMENT
09-09-2025
يواجه قطاع التكنولوجيا تباطؤًا في التوظيف: ارتفاع التسريحات بينما تكافح الولايات للاحتفاظ بالمواهب
استكشف أحدث تقرير للوظائف في الولايات المتحدة يكشف عن تباطؤ في قطاع التكنولوجيا، مع فقدان الوظائف وصعوبة الولايات في جذب واستبقاء المواهب التقنية. افهم التحول نحو الأتمتة والمهارات المتخصصة.
13-11-2025
الهلوسة الاصطناعية أم الدين الرقمي؟ تفكيك ظاهرة "اللولبية"
استكشف «اللولبية»، الظاهرة التي يعتقد فيها مستخدمون أن حديثهم مع روبوتات الدردشة يحمل طابعاً دينياً. هل هو وهم الذكاء الاصطناعي، أم دين رقمي جديد، أم مجرد انعكاس لعلم النفس البشري ومطابقة الأنماط؟
05-08-2025
الذكاء الاصطناعي يغذي ارتفاع أسعار الكهرباء
اكتشف كيف يؤدي الطلب المتزايد على الذكاء الاصطناعي إلى ارتفاع أسعار الكهرباء وإجهاد شبكات الطاقة في جميع أنحاء البلاد، مما يؤثر على فواتير المستهلكين.
ADVERTISEMENT
01-07-2025
حققت Unitree Robotics مكانة الشركة اليونيكورن بتقييم 1.7 مليار دولار.
حققت Unitree Robotics مكانة الشركة الناشئة المليارية بتقييم قدره 1.7 مليار دولار بعد تأمين تمويل من السلسلة C، بقيادة مستثمرين رئيسيين مثل Tencent و Alibaba، مما يسلط الضوء على نموها في مجال الروبوتات ذات الأرجل بأسعار معقولة.
09-06-2025
الكشف عن أطلس: كيف يرى روبوت بوسطن ديناميكس الشبيه بالبشر العالم
اكتشف كيف يدرك روبوت أطلس البشري من بوسطن ديناميكس العالم، مستخدمًا أجهزة استشعار متقدمة ومعالجة البيانات في الوقت الفعلي لتحقيق رشاقة وتفاعل بيئي لا مثيل لهما.
18-08-2025
نظارات ميتا للواقع المعزز 'هايبرنوفا' تستعد لظهور أرخص
من المتوقع أن تُطلق نظارات الواقع المعزز "هايبرنوفا" القادمة من ميتا بسعر أقل يبلغ حوالي 800 دولار، مما قد يجعل تقنية الواقع المعزز في متناول المستهلكين بشكل أكبر.
ADVERTISEMENT