يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

09-08-2025
تاريخ إصدار جهاز الألعاب المحمول ASUS ذو العلامة التجارية Xbox مسرب
معلومات مسربة تشير إلى أن جهاز الألعاب المحمول ASUS ROG Ally الذي يحمل علامة Xbox التجارية سيُطلق في أوروبا في 16 أكتوبر، مع بدء الطلبات المسبقة في 20 أغسطس.
ADVERTISEMENT
26-05-2025
ملاكمة الروبوتات: إنجازات مذهلة لروبوتات صينية في حلبة الملاكمة
ملاكمة الروبوتات: إنجازات مذهلة لروبوتات صينية في حلبة الملاكمة.
30-05-2025
GeForce Now على Steam Deck: ثورة في ألعاب AAA المحمولة
اكتشف كيف يُحدث تطبيق Nvidia GeForce Now ثورة في تجربة الألعاب على Steam Deck، مما يتيح لك لعب ألعاب AAA المتطلبة رسوميًا بسلاسة مع عمر بطارية أطول وأداء محسن.
18-08-2025
الرئيس التنفيذي لدوولينجو يدعو إلى محادثات الذكاء الاصطناعي في التعليم
الرئيس التنفيذي لدوولينجو لويس فون آن يناقش الإمكانات التحويلية والاعتبارات الأخلاقية للذكاء الاصطناعي في التعليم، داعياً إلى حوار تعاوني.
ADVERTISEMENT
07-08-2025
هواتف جوجل بيكسل تستعد للحصول على قلب شريط التنقل لمستخدمي سامسونج
يُقال إن جوجل تضيف ميزة إلى أندرويد الخام لقلب شريط التنقل، مما يسهل الانتقال لمستخدمي سامسونج. اكتشف التفاصيل والإصدار المتوقع.
05-08-2025
جنون إنفاق وادي السيليكون على الذكاء الاصطناعي: مايكروسوفت تقود الهجوم مع جني الاستثمارات لثمارها
إنفاق وادي السيليكون على الذكاء الاصطناعي يتصاعد بشكل صاروخي، مع تصدر ميتا ومايكروسوفت للمشهد. اكتشف كيف يستثمر عمالقة التكنولوجيا هؤلاء المليارات في الذكاء الاصطناعي والتأثير المحتمل على الصناعة.
08-07-2025
روبوت Agibot X2-N: الروبوت البشري الذي يرى بدون عيون
تكشف Agibot عن X2-N، وهو روبوت بشري يتمتع بحركة ثنائية الوضع وملاحة بدون كاميرا، مما يضع معايير جديدة للاستقلالية الروبوتية والقدرة على التكيف.
ADVERTISEMENT
05-08-2025
تطلق راوند هيل للاستثمارات صندوق ETF للروبوتات البشرية للانكشاف المستهدف
يناقش ديفيد مازا، الرئيس التنفيذي لشركة Roundhill Investments، إطلاق صندوق استثمار متداول (ETF) جديد يركز على الروبوتات البشرية، مما يوفر للمستثمرين انكشافًا على الشركات التي تسوّق هذه الآلات المتقدمة.
28-07-2025
روبوتات الصين الشبيهة بالبشر: لمحة عن طموحات الذكاء الاصطناعي
مؤتمر الصين العالمي للذكاء الاصطناعي في شنغهاي يسلط الضوء على التطورات في الروبوتات الشبيهة بالبشر والبشر الرقميين، مما يعرض طموح الأمة في تطوير الذكاء الاصطناعي وحوكمته.
20-05-2025
هل يمكن الوثوق بسام ألتمان في المستقبل؟
تتناول هذه المقالة الجدل حول سام ألتمان، الرئيس التنفيذي لشركة OpenAI، وتأثيره على مستقبل الذكاء الاصطناعي.
ADVERTISEMENT
11-06-2025
فك شفرة الواقع: كيف يرى روبوت أطلس من بوسطن ديناميكس العالم
اكتشف كيف يدرك روبوت أطلس البشري من بوسطن ديناميكس بيئته ويتفاعل معها من خلال دمج المستشعرات المتقدم ورسم الخرائط في الوقت الفعلي.
05-08-2025
شاشات قفل الآيفون تحصل على تحول ثلاثي الأبعاد مع مشهد iOS 26 المكاني
اكتشف كيف تحول ميزة المشهد المكاني الجديدة iOS 26 من Apple شاشة قفل iPhone الخاصة بك إلى تجربة ثلاثية الأبعاد ديناميكية. تعرف على كيفية تمكين وتخصيص تأثير الخلفية المبتكر هذا.
09-08-2025
اصطدام الكويكب مقابل المخاطر اليومية: دراسة جديدة تضع المخاطر في منظورها الصحيح
دراسة جديدة تقارن احتمالات الوفاة من اصطدام كويكب مقابل المخاطر اليومية مثل ضربات البرق وحوادث السيارات، مما يقدم منظورًا فريدًا حول المخاطر العالمية والفردية.
ADVERTISEMENT
15-07-2025
ظهور قمر صناعي صيني سري في مدار غير مسبوق بعد اختفاء دام أسبوعًا
اختفى قمر صناعي صيني سري، شييان-28 بي 01، لمدة ستة أيام بعد الإطلاق قبل أن يظهر مجددًا في مدار منخفض غير مسبوق، مما أثار تكهنات حول الغرض منه.
26-05-2025
نظارات ذكية مدعومة بالذكاء الاصطناعي: هل يمكنها تقليل أخطاء الأدوية؟
تسعى الأبحاث في جامعة واشنطن إلى استخدام الذكاء الاصطناعي في تطوير نظارات ذكية تساعد في تقليل الأخطاء الطبية المتعلقة بالأدوية وتحسين سلامة المرضى.
02-07-2025
الموسم الثالث من المؤسسة: رحلة ديميرزل الوجودية
استكشف كيف يتعمق الموسم الثالث من "المؤسسة" في أزمة ديميرزل الوجودية بينما يتصارع الروبوت القديم مع هدفه وسط اضطرابات مجرية. تناقش لورا بيرن رحلة شخصيتها العميقة.
ADVERTISEMENT