يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

14-08-2025
الثلاثاء الخاص بتصحيحات مايكروسوفت لشهر أغسطس: إصلاح ثغرة كيربيروس ليوم الصفر و110 ثغرات أخرى
يعالج الثلاثاء الأمني لشهر أغسطس 2025 من مايكروسوفت 111 ثغرة أمنية، بما في ذلك ثغرة حرجة من نوع "يوم الصفر" في Kerberos (CVE-2025-53779) وثغرات أخرى عالية الخطورة في Azure و GDI+ ورسومات Windows.
ADVERTISEMENT
26-05-2025
جوجل تستثمر في نموذجها العالمي: بناء طبقة الذكاء الاصطناعي قبل أن تسيطر مايكروسوفت على واجهة المستخدم
تستعرض جوجل استراتيجيتها لبناء نموذج عالمي للذكاء الاصطناعي خلال حدث I/O 2025، مع التركيز على الابتكارات والتحديات في مواجهة المنافسة.
17-07-2025
أعلن ماسك عن رفيق Grok AI الجديد الذي يعكس الملياردير
إيلون ماسك يثير التشويق لرفيق ذكر جديد يعمل بالذكاء الاصطناعي على منصة Grok الخاصة به، مستوحى من إدوارد كولين وكريستيان جراي، مما يثير تساؤلات حول الملكية الفكرية والصورة الذاتية والرومانسية الرقمية.
27-08-2025
نفيديا 'عقل الروبوت' تستعد لإعادة تشكيل أتمتة سلسلة التوريد
تهدف حزمة المطور الجديدة Jetson AGX Thor من إنفيديا إلى إحداث ثورة في الروبوتات وأتمتة سلسلة التوريد من خلال تمكين الذكاء الاصطناعي المادي المتقدم وتنفيذ المهام المتزامن في الروبوتات.
ADVERTISEMENT
30-06-2025
الاستيلاء على الذكاء الاصطناعي: الرؤساء التنفيذيون يؤكدون أن وظيفتك على المحك
استكشف كيف يشير كبار الرؤساء التنفيذيين في مجال التكنولوجيا بهدوء إلى أن الذكاء الاصطناعي سيحل محل الوظائف البشرية، وليس فقط يعززها، مما يؤدي إلى تسريع عمليات التسريح على الرغم من القوة الاقتصادية.
17-07-2025
علماء الفلك يلتقطون أول لمحة لنظام شمسي قيد التكوين
تمكن علماء الفلك من التقاط الصور الأولى لنجم أولي شبيه بالشمس، HOPS-315، وكشفوا عن مركبات تشكل الكواكب في قرصه الكوكبي الأولي بفضل JWST و ALMA.
04-07-2025
تطبيق شونين جامب يرفع حد القراءة اليومي، ويقدم وصولاً غير محدود إلى المانجا
تطبيق شونين جامب يزيل حد الفصل اليومي، مما يسمح للمشتركين بقراءة مانغا غير محدودة. اكتشف كيف يعزز هذا التغيير تجربة القراءة للمسلسلات الشهيرة مثل ون بيس وناروتو.
ADVERTISEMENT
28-09-2025
الروبوتات الشبيهة بالبشر تدشن عصرًا جديدًا في بناء السفن، معززة الكفاءة والسلامة
يتم دمج الروبوتات الشبيهة بالبشر في أحواض بناء السفن لتعزيز السلامة والكفاءة، مما يمثل تقدمًا تكنولوجيًا كبيرًا في الصناعة البحرية. تعرف على المزيد حول هذا التعاون وتداعياته.
22-08-2025
بكسل مثالي: الدليل الشامل لحماية هاتف جوجل بكسل الجديد الخاص بك
اكتشف أفضل الحافظات لهاتف جوجل بيكسل الخاص بك، والتي توفر الحماية والأناقة والوظائف. استكشف الخيارات المتينة والنحيفة والشفافة وخيارات المحفظة للحفاظ على جهازك آمنًا.
05-09-2025
Ecovacs Deebot X11 OmniCyclone يضع معايير جديدة لمكانس الروبوت الذكية بالذكاء الاصطناعي — بسعر مرتفع
أطلقت شركة Ecovacs المكنسة الروبوتية Deebot X11 OmniCyclone المدعومة بالذكاء الاصطناعي في معرض IFA 2025، حيث توفر تقنية متقدمة لتنظيف الحواف، وتحسين الجدول الزمني تلقائيًا، والتكامل مع المنزل الذكي، والشحن السريع—وذلك بسعر مرتفع.
ADVERTISEMENT
23-09-2025
روبوت ووكر S2 من UBTECH يحقق إنجازًا غير مسبوق في التشغيل على مدار الساعة طوال أيام الأسبوع بفضل تبديل البطارية الذاتي
روبوت ووكر S2 من UBTECH يمكنه الآن تبديل بطاريته الخاصة بشكل مستقل، مما يتيح التشغيل على مدار الساعة طوال أيام الأسبوع ويعزز الكفاءة الصناعية.
29-09-2025
جهاز أمازون فاير ماكس 11 اللوحي يصل إلى أدنى سعر له على الإطلاق، منافساً الآيباد
جهاز تابلت أمازون فاير ماكس 11 متاح الآن بسعر منخفض تاريخي قدره 139 دولارًا، مما يجعله منافسًا قويًا لجهاز آبل آيباد. اكتشف ميزاته وأداءه وقيمته.
22-05-2025
مايكروسوفت تضيف أكثر من 50 لعبة كلاسيكية إلى Game Pass
مايكروسوفت تضيف أكثر من 50 لعبة كلاسيكية إلى Game Pass، تشمل ألعاب من Activision من الثمانينيات والتسعينيات، مع التزام بالحفاظ على الألعاب والتوافق مع الإصدارات السابقة.
ADVERTISEMENT
06-10-2025
فايرفلاي من أدوبي يحوّل صورك إلى فيديوهات جذابة: ثورة في الإبداع الحركي
تقدم أدوبي Firefly، أداة مدعومة بالذكاء الاصطناعي تقوم بإنشاء مقاطع فيديو من الصور أو التعليمات النصية. اكتشف كيف يغيّر Firefly عملية إنشاء المحتوى الرقمي بسهولة ومرونة.
17-06-2025
مستخدمو إنستغرام يواجهون حظرًا جماعيًا، ويشتبه في الذكاء الاصطناعي
يبلغ مستخدمو Instagram عن حظر واسع النطاق للحسابات عن طريق الخطأ، ويشتبه الكثيرون في أن السبب هو الأتمتة بالذكاء الاصطناعي. تؤثر هذه المشكلة على سبل العيش وقد أدت إلى دعوات لاتخاذ إجراءات قانونية.
30-05-2025
جوجل Veo 3: هل يهدد الذكاء الاصطناعي الإبداع البشري؟
تثير جوجل Veo 3 قلقًا وجوديًا بشأن مستقبل الإبداع البشري وتأثير الذكاء الاصطناعي على الصناعات الفنية، مع تساؤلات حول قيمة الفن الذي يولده الذكاء الاصطناعي.
ADVERTISEMENT