يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

09-12-2025
5 اتجاهات رئيسية تشكل صعود النظارات الذكية في عام 2025
استكشف خمسة اتجاهات رئيسية تشكل مستقبل النظارات الذكية المدعومة بالذكاء الاصطناعي في عام 2025، مع أمثلة واقعية من جوجل وميتا تدفع تبني الصناعة.
ADVERTISEMENT
28-08-2025
ساعة أبل السلسلة 11 وألترا 3 تُطلق قريباً: ماذا نتوقع؟
حدث آبل القادم "المذهل" في 9 سبتمبر من المقرر أن يكشف عن ساعة أبل ووتش سيريس 11 وربما ألترا 3، مع تواريخ إصدار متوقعة في منتصف سبتمبر. اكتشف شائعات التصميم والمعالج والبطارية وميزات الصحة.
25-11-2025
أفضل 10 اتجاهات رئيسية في النظارات الذكية الاستهلاكية بحلول عام 2025
اكتشف أهم 10 اتجاهات تشكل نظارات المستهلك الذكية بحلول عام 2025، بما في ذلك الاستبدال، والتسعير، والتكامل، والنظم البيئية المتطورة. اقرأ رؤى موجزة مدعومة بالبيانات.
02-07-2025
كرة القدم الآلية تظهر لأول مرة مع خروج محرج على نقالة
اكتشف العالم المرح والدرامي بشكل مفاجئ لكرة القدم الآلية، حيث يتقن بالفعل الروبوتات الشبيهة بالبشر والمدعومة بالذكاء الاصطناعي فن الخروج من الملعب على نقالة.
ADVERTISEMENT
06-10-2025
تُعتبر نظارات ميتا الذكية روادًا في الصناعة—ولكنها ليست نجاحات ضخمة، حسب قول المحللين
تُعتبر النظارات الذكية الجديدة من ميتا مبتكرة ولكن من المرجح أن تكون مبيعاتها منخفضة الحجم، وفقًا للمحللين. تظل الشركة تركز على الذكاء الاصطناعي والإعلانات والريادة في تكنولوجيا الواقع الممتد، حيث تمهد النظارات الذكية الطريق للتطورات المستقبلية.
07-07-2025
Lenovo Chromebook Plus 14: البطل الجديد المتوج لأجهزة Chromebook
اكتشف لماذا يتم الإشادة بجهاز Lenovo Chromebook Plus 14 باعتباره الملك الجديد لأجهزة Chromebook، حيث يقدم شاشة OLED وأداءً قويًا وعمر بطارية استثنائيًا بسعر تنافسي.
15-09-2025
سامسونج جالكسي بادز 3 FE: صوت جيد، ولكن هل هي كافية؟
مراجعة لسماعات Samsung Galaxy Buds 3 FE، تسلط الضوء على جودة الصوت الرائعة ولكنها تشير إلى تنازلات في إلغاء الضوضاء النشط (ANC) والميزات مقابل سعرها البالغ 150 دولارًا.
ADVERTISEMENT
08-09-2025
تلف كابل البحر الأحمر يؤدي إلى تباطؤ واسع النطاق للإنترنت في جميع أنحاء الشرق الأوسط، وقد تستغرق الإصلاحات شهورًا
تواجه خدمات الإنترنت في الشرق الأوسط تباطؤًا طويل الأمد بسبب تلف كابلات البحر الأحمر، وقد تستغرق الإصلاحات شهورًا. تعرف على التأثير وعملية الإصلاح المعقدة.
07-07-2025
سامسونج HW-Q990F: الملك المتوج لأنظمة الصوت الشريطية بتقنية Dolby Atmos
اكتشف Samsung HW-Q990F، مكبر الصوت الرئيسي Dolby Atmos لشركة Samsung لعام 2025. يسلط هذا الاستعراض الضوء على صوته الغامر ومضخم الصوت المدمج والميزات المتميزة.
23-09-2025
تلفزيون جوجل يتبنى ذكاء جيميني الاصطناعي لتجربة مشاهدة أكثر حوارية
تلفزيون جوجل يدمج الذكاء الاصطناعي Gemini ليقدم تجربة مشاهدة أكثر تفاعلية وبديهية، مما يغير طريقة اكتشاف المستخدمين للمحتوى وتفاعلهم مع أجهزة التلفزيون الخاصة بهم.
ADVERTISEMENT