يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

06-04-2026
صعود الروبوتات الشبيهة بالبشر يخلق فرصة عمل جديدة مفاجئة
اكتشف الوظيفة الجديدة المفاجئة التي نشأت عن صعود الروبوتات الشبيهة بالبشر، حيث يقوم الأفراد بتسجيل المهام اليومية لتدريب الذكاء الاصطناعي.
ADVERTISEMENT
06-04-2026
مواجهة النظام البيئي: كيف تبقي OneNote المستخدمين مرتبطين بمايكروسوفت
مقارنة بين Google Workspace و Microsoft 365؟ اكتشف لماذا تخلق الميزات الفريدة لبرنامج Microsoft OneNote عقبة كبيرة أمام المستخدمين الذين يحاولون الانتقال بين النظامين البيئيين.
06-04-2026
تطور ثقافة الشركات الناشئة: نظرة على مؤسسي الذكاء الاصطناعي اليوم
اتجاه جديد يشهد قيام مستثمري رأس المال المغامر بتقديم دعم شامل لمؤسسي الذكاء الاصطناعي الشباب. كيف يقارن هذا بالطفرة التكنولوجية السابقة وماذا يشير ذلك؟
07-04-2026
بكسل 10a: نظرة فنية معمقة على خليفة تكراري
مقارنة تقنية لجهاز جوجل بيكسل 10a. نحلل أداءه وكاميرته وتصميمه مقارنة بسابقه لمعرفة ما إذا كان هذا التحديث التكراري يستحق العناء.
ADVERTISEMENT
08-04-2026
آيفون آبل القابل للطي ومستقبل تكنولوجيا الهواتف المحمولة
من المتوقع أن يُحدث هاتف iPhone القابل للطي الذي طال انتظاره من Apple ضجة في صناعة الهواتف المحمولة. استكشف الاتجاهات الرئيسية التي تشير إليها هذه الخطوة لمستقبل الهواتف الذكية.
09-04-2026
براعة التصنيع الصينية تغذي سباق الأجهزة العالمي للروبوتات الشبيهة بالبشر، ويكشف عرض Nvidia
يُبرز العرض التوضيحي الأخير لشركة Nvidia الدور الحاسم للصين في سلسلة توريد الأجهزة لصناعة الروبوتات البشرية المزدهرة، مما يكمل ريادة الولايات المتحدة في مجال الذكاء الاصطناعي وتصميم الرقائق.
13-04-2026
آيفون قابل للطي من آبل: صور مسربة تلمح إلى تصميم مذهل ونافذة إصدار محتملة
تشير الصور المسربة والمعلومات الداخلية إلى أن هاتف آبل القابل للطي، والذي قد يُطلق عليه اسم "آيفون فولد"، قد يتميز بتصميم لافت للنظر وإصدار في أواخر عام 2026 أو أوائل عام 2027.
ADVERTISEMENT
13-04-2026
الروبوت البشري الجديد في الصين يعيد تعريف العمل الصناعي عالي المخاطر
استكشف أول روبوت بشري يعمل بالذكاء الاصطناعي في الصين مصمم للمهام الصناعية عالية الخطورة. تعرف على قدراته المتقدمة وتأثيره على سلامة العمال.
14-04-2026
الروبوتات الشبيهة بالبشر تدخل ساحة التصنيع
استكشف صعود الروبوتات الشبيهة بالبشر في التصنيع. تعرف على الذكاء الاصطناعي المتقدم والأجهزة التي تشغل نماذج مثل أبولو وأطلس في أرض المصنع.
14-04-2026
جيميني يكشف عن تصورات تفاعلية لتعزيز فهم المحادثة
يقوم Gemini AI من Google الآن بإنشاء تصورات تفاعلية في الدردشة، مما يعزز فهم المستخدم للمواضيع المعقدة. تعرف على هذه الميزة الجديدة وقدراتها وتوفرها.
ADVERTISEMENT