يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

29-10-2025
Gemini AI ستعزز تجربة Google TV هذا الشتاء
جهاز Gemini AI من جوجل سيصل إلى المزيد من الأجهزة، بما في ذلك جهاز Google TV Streamer، هذا الشتاء، ليقدم ميزات ترفيهية محسنة وتفاعلات حوارية.
ADVERTISEMENT
28-09-2025
شركة بولندية تكشف عن روبوت بشري واقعي بشكل مقلق، بروتوكلون
كشفت شركة كلون روبوتيكس عن البروتوكلون، وهو روبوت بشري نابض بالحياة بشكل مقلق يستخدم تصميمًا محاكيًا للطبيعة وعضلات اصطناعية لحركة متقدمة شبيهة بالإنسان.
28-05-2025
دراسة جديدة تكشف كيفية تشكيل الكواكب ذات المدارات الواسعة، مما يدعم وجود الكوكب التاسع
دراسة جديدة تكشف كيفية تشكيل الكواكب ذات المدارات الواسعة، مما يدعم وجود الكوكب التاسع في نظامنا الشمسي.
12-09-2025
روبيانت تكشف عن R1: روبوت منزلي بطموحات طهوية، لكنه لا يزال قيد التطوير
تكشف روبيانت عن آر1، روبوت بشري جديد مصمم ليكون رفيقًا منزليًا ذكيًا قادرًا على الطهي ومهام أخرى، لكنه لا يزال قيد التطوير والاختبار.
ADVERTISEMENT
21-10-2025
سامسونج Exynos 2600 ستشغل جميع طرازات Galaxy S26، مع أداء ذكاء اصطناعي فائق
تم تأكيد معالج Exynos 2600 من سامسونج لجميع طرازات Galaxy S26، متفوقًا على شرائح Apple و Qualcomm في أداء الذكاء الاصطناعي والرسومات.
26-06-2025
فشل المهمة المدارية: فقدان رفات بشرية ومخدرات فضائية في المحيط الهادئ
انتهت مهمة مدارية حديثة، "مهمة ممكنة"، بالفشل بعد تحطم مركبة فضائية تحمل رفات بشرية وقنب هندي في المحيط الهادئ بسبب عطل في نظام المظلة.
02-10-2025
التنقل في Xbox Game Pass الخاص بك: دليل للإلغاء أو الرجوع إلى إصدار أقدم وسط ارتفاعات الأسعار
تعرف على كيفية إلغاء أو تخفيض مستوى اشتراك Xbox Game Pass الخاص بك بعد الزيادات الأخيرة في الأسعار. يقدم هذا الدليل إرشادات خطوة بخطوة لإدارة اشتراكك عبر الإنترنت.
ADVERTISEMENT
20-10-2025
بنك طاقة ضخم بسعة 50000 مللي أمبير يصل إلى أدنى سعر له على الإطلاق على أمازون
اكتشف باور بانك Ohoviv بسعة 50000 مللي أمبير في الساعة، الآن بسعر منخفض على الإطلاق يبلغ 32 دولارًا على أمازون لأعضاء برايم. تعرف على سعته الهائلة، والشحن السريع، والكابلات المدمجة.
11-10-2025
المتسلل الكوني الخافت: علماء الفلك يرصدون جسماً نادراً قد يكشف أسرار المادة المظلمة
اكتشف علماء الفلك جسماً باهتاً منخفض الكتلة في الفضاء السحيق قد يكون دليلاً على المادة المظلمة، حيث استخدموا عدسة الجاذبية لرصد تأثيره على الضوء البعيد. قد يمثل هذا أصغر تجمع للمادة المظلمة يتم اكتشافه حتى الآن ويعزز فهمنا للكون.
27-06-2025
كمبيوتر Surface المحمول مقاس 13 بوصة من Microsoft: خطوة للوراء، ولكنه لا يزال قادرًا
مراجعة لجهاز Surface Laptop الجديد مقاس 13 بوصة من Microsoft، مع تسليط الضوء على تنازلاته في التصميم والأداء مقارنة بالموديلات السابقة، وموقعه في السوق.
ADVERTISEMENT