يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

13-10-2025
تستعد آبل لمستقبل سماعات AirPods مع شريحة H3 من الجيل التالي وسماعات AirPods 5
يقال إن آبل تعمل على تطوير شريحة H3 وسماعات AirPods 5 من الجيل التالي، مع التركيز على تقليل زمن الاستجابة، وتحسين جودة الصوت، وميزات صحية جديدة.
ADVERTISEMENT
16-12-2025
مشغلات MP3 مقابل خدمات بث الموسيقى: تحليل مقارن لعشاق التكنولوجيا
استكشف مقارنة تقنية بين مشغلات MP3 الحديثة وخدمات بث الموسيقى، مع التركيز على جودة الصوت وسهولة الاستخدام وتجربة المستخدم لعشاق التكنولوجيا.
12-11-2025
سعر ساوند بار أمازون فاير تي في يصل إلى أدنى مستوى له على الإطلاق، مما يعزز تجربة الصوت التلفزيوني والبلوتوث لديك
اكتشف كيف يمكن لشريط الصوت Fire TV من أمازون، بسعر منخفض على الإطلاق الآن، تحسين صوت التلفزيون بشكل كبير والعمل كمكبر صوت بلوتوث متعدد الاستخدامات لغرفة المعيشة الخاصة بك.
30-09-2025
يتيح لك ChatGPT الآن شراء المنتجات مباشرة: إطلاق فوري للدفع مع Etsy و Shopify
تقدم OpenAI ميزة الدفع الفوري لـ ChatGPT، مما يتيح للمستخدمين شراء المنتجات مباشرة من Etsy و Shopify داخل روبوت الدردشة المدعوم بالذكاء الاصطناعي. تعرف على كيفية عمل هذه الميزة وتأثيراتها على التجارة الإلكترونية.
ADVERTISEMENT
22-08-2025
ناسا وآي بي إم تطلقان سوريا: نموذج ذكاء اصطناعي سيُحدث ثورة في التنبؤ بالتوهجات الشمسية
ناسا وآي بي إم تقدمان "سوريا"، نموذج ذكاء اصطناعي جديد مصمم للتنبؤ بالانفجارات الشمسية والعواصف المغناطيسية الأرضية بدقة محسنة ووقت استباقي أطول، وذلك باستخدام بيانات من مرصد ديناميكيات الشمس التابع لناسا.
22-01-2026
الاتجاهات الناشئة في الأجهزة القابلة للارتداء المدعومة بالذكاء الاصطناعي: لمحة سريعة لعام 2026
استكشف أهم اتجاهات الأجهزة القابلة للارتداء بالذكاء الاصطناعي لعام 2026: واجهات الصوت أولاً، والخصوصية، وتطبيقات المؤسسات، والمزيد مع رؤى حول دبوس الأجهزة القابلة للارتداء بالذكاء الاصطناعي من Apple.
20-01-2026
يُشاع أن آيفون 18 برو سيحتوي على Face ID تحت الشاشة، لكن مصير Dynamic Island لا يزال غير مؤكد
استكشف أحدث الشائعات حول iPhone 18 Pro، بما في ذلك احتمالية وجود Face ID تحت الشاشة والمستقبل غير المؤكد لـ Dynamic Island.
ADVERTISEMENT
20-08-2025
كوالكوم تكشف عن سنابدراجون 7s الجيل الرابع مع تحسينات متواضعة في الأداء
كوالكوم تعلن عن سنابدراجون 7s الجيل الرابع، وهي شريحة جديدة متوسطة المدى تقدم مكاسب أداء طفيفة، ودعم شاشة محسّن، وقدرات ذكاء اصطناعي محسّنة.
13-11-2025
أهم اتجاهات الروبوتات الشبيهة بالبشر التي يجب مراقبتها بعد عام 2025
أهم اتجاهات الروبوتات الشبيهة بالبشر التي يجب مراقبتها بعد عام 2025
25-12-2025
أبرز اتجاهات الروبوتات التي عرضتها شركة Richtech Robotics في معرض الإلكترونيات الاستهلاكية 2026
استكشف اتجاهات الروبوتات الرئيسية لعام 2026 كما عرضتها شركة Richtech Robotics في معرض CES - الروبوتات البشرية المدعومة بالذكاء الاصطناعي، وأتمتة الخدمات، والبنية التحتية للبيانات، واستراتيجيات الصناعة.
ADVERTISEMENT