يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

05-08-2025
الأشعة الكونية قد تفتح آفاقًا جديدة في البحث عن الحياة الفضائية
نظرية جديدة تقترح أن الأشعة الكونية قد تمكّن الحياة في بيئات باردة ومظلمة بعيدًا عن النجوم، مما قد يوسع نطاق البحث عن الحياة خارج كوكب الأرض إلى ما وراء المنطقة التقليدية الصالحة للسكن.
ADVERTISEMENT
24-07-2025
صيحة SpaceX المدارية: الاتهامات تتطاير وسط ازدحام الأقمار الصناعية
تنتقد سبيس إكس الأقمار الصناعية الكبيرة لشركة AST SpaceMobile لمخاطرها المدارية، مما يثير اتهامات بالنفاق بسبب شبكتها الواسعة من الأقمار الصناعية والحوادث الوشيكة السابقة.
18-07-2025
وجه الإيموجي المشوه: طريقتك المفضلة التالية للتعبير عن الإحراج
اكتشف الرموز التعبيرية الجديدة القادمة إلى هاتفك، بما في ذلك رمز الوجه المشوه المنتظر بشدة، والمصمم للتعبير عن الحرج والصراع الذهني.
18-07-2025
ضحايا رياح ترينيتي في نيو مكسيكو: محاسبة طال انتظارها
بعد ثمانين عامًا من الانفجار الذري "ترينيتي"، قد يحصل أهالي "المناطق المجاورة" في نيو مكسيكو أخيرًا على تعويضات عن المشاكل الصحية التي سببها التساقط الإشعاعي. تعرف على المعركة الطويلة من أجل العدالة.
ADVERTISEMENT
24-07-2025
وضع توفير الطاقة الجديد لجهاز PS5 قد يقلل من أداء الألعاب لتوفير الطاقة
يقدم تحديث PS5 التجريبي الجديد من سوني وضع "توفير الطاقة" الذي قد يحد من أداء الألعاب لتقليل استهلاك الطاقة، بالإضافة إلى ميزة جديدة لمزامنة وحدات التحكم متعددة الأجهزة.
16-09-2025
نظارات ميتا الذكية القادمة تستعد للظهور الأول تحت علامة راي بان مع شاشة عرض رأسية متطورة
يُشاع أن نظارات ميتا الذكية القادمة، التي تتميز بشاشة عرض رأسية (HUD) وربما تحمل علامة راي بان التجارية، ستُكشف عنها قريبًا، وربما إلى جانب نظارات أوكلي الرياضية الجديدة.
04-09-2025
شي إن تتعرض لانتقادات حادة لاستخدامها صورة يُشتبه في أنها مولدة بالذكاء الاصطناعي للويجي مانجيوني لعرض الأزياء
تُحقق شركة التجزئة للأزياء السريعة "شي إن" في استخدام صورة يُشتبه بأنها مُولّدة بالذكاء الاصطناعي للويجي مانجيوني، المتهم في قضية قتل، لعرض الملابس على منصتها.
ADVERTISEMENT
23-05-2025
Xiaomi PU7: تهديد جديد لتيسلا في سوق السيارات الكهربائية بالصين
تستعد شاومي لإطلاق سيارتها الكهربائية PU7، التي تهدد مكانة تيسلا في السوق الصينية، مع ميزات متقدمة وأداء قوي.
21-05-2025
طلاب مدرسة هاوارد بيشوب يرسلون رسائل إلى الفضاء للمرة الثانية
طلاب مدرسة هاوارد بيشوب المتوسطة يرسلون رسائل إلى الفضاء للمرة الثانية، بعد عودة بطاقات بريد سابقة. المبادرة تعزز الإبداع والفضول حول استكشاف الفضاء.
12-09-2025
Assassin's Creed Shadows DLC يَعِدُ بإغلاق خطوط قصصية رئيسية
اكتشف كيف سيختتم المحتوى الإضافي "مخالب أواجي" للعبة Assassin's Creed Shadows خطوطًا قصصية رئيسية، بما في ذلك مهمة ناوي الشخصية ولغز الصندوق الثالث، مع ترك الباب مفتوحًا للمحتوى المستقبلي.
ADVERTISEMENT
26-05-2025
روبوت منزلي إنساني بقيمة 20000 دولار من UBTech لتلبية احتياجات رعاية المسنين
UBTech تستعد لإطلاق روبوت منزلي إنساني بقيمة 20000 دولار لتلبية احتياجات رعاية المسنين وسط الطلب المتزايد على هذه الحلول.
05-09-2025
جوجل ستحظر التحميل الجانبي لتطبيقات أندرويد غير الموثقة العام المقبل
تعتزم جوجل حظر التحميل الجانبي لتطبيقات أندرويد غير الموثوقة بدءًا من العام المقبل، مما يؤثر على توزيع التطبيقات وأمنها استجابةً لأحكام مكافحة الاحتكار.
04-06-2025
صور الأقمار الصناعية تكشف عن تسونامي ضخم تسبب في هزات عالمية لمدة تسعة أيام
تؤكد صور الأقمار الصناعية الجديدة أن موجات تسونامي العملاقة في مضيق ديكسون البحري في غرينلاند تسببت في هزات عالمية لمدة تسعة أيام، مما يكشف عن صلة مباشرة بتسارع تغير المناخ.
ADVERTISEMENT
09-09-2025
يُشاع إطلاق AirPods Pro 3 هذا الأسبوع إلى جانب iPhone 17
أفاد المحلل مينغ تشي كو أن من المقرر إطلاق سماعات AirPods Pro 3 هذا الأسبوع، ربما إلى جانب هاتف iPhone 17، مع توقع ميزات جديدة مثل مستشعر معدل ضربات القلب وشريحة H3.
23-07-2025
الصين تكشف النقاب عن Walker S2: أول روبوت مستقل في العالم ببطاريات ذاتية التبديل
اكتشف Walker S2، أول روبوت مستقل في العالم من UBTech Robotics، قادر على التشغيل المستمر عن طريق التبديل الذاتي لبطارياته. تعرف على كيف أن هذا الابتكار سيحدث ثورة في الأتمتة الصناعية.
05-08-2025
شاشات قفل الآيفون تحصل على تحول ثلاثي الأبعاد مع مشهد iOS 26 المكاني
اكتشف كيف تحول ميزة المشهد المكاني الجديدة iOS 26 من Apple شاشة قفل iPhone الخاصة بك إلى تجربة ثلاثية الأبعاد ديناميكية. تعرف على كيفية تمكين وتخصيص تأثير الخلفية المبتكر هذا.
ADVERTISEMENT