يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

17-06-2025
مفاجأة لمستخدمي Windows 11: رنة Vista الشهيرة تعود عن طريق الخطأ
استبدلت مايكروسوفت عن طريق الخطأ صوت بدء تشغيل ويندوز 11 بنغمة ويندوز فيستا الكلاسيكية في إصدار تجريبي حديث من Insider Preview، وهو خلل مؤقت سيتم إصلاحه.
ADVERTISEMENT
11-06-2025
أندرويد 16 يطلق أربع ترقيات مجانية رئيسية لهاتفك
اكتشف الترقيات المجانية الأربع الرئيسية القادمة لهواتف Android مع إصدار Android 16، مما يعزز الأمان والإنتاجية وتجربة المستخدم.
27-08-2025
يوتيوب تتصدى لرد فعل عنيف من المبدعين بسبب تعديلات الفيديو المزعومة بالذكاء الاصطناعي
تتصدى يوتيوب لمخاوف المبدعين بشأن تعديل الذكاء الاصطناعي لمقاطع فيديو Shorts، وتعلن عن خطط لميزة إلغاء الاشتراك وسط نقاشات حول الشفافية والأصالة.
21-08-2025
جوجل قفزة مغناطيسية: بيكسل سناب يصل لسلسلة بيكسل 10
جوجل تكشف النقاب عن PixelSnap، نظامها الجديد للملحقات المغناطيسية لسلسلة Pixel 10، مما يوفر وظائف شبيهة بـ MagSafe مع الشواحن، والحوامل، والمزيد.
ADVERTISEMENT
01-07-2025
الألبان قبل النوم: وصفة للكوابيس؟
تشير دراسة جديدة إلى وجود صلة بين تناول منتجات الألبان قبل النوم وتجربة الكوابيس، خاصة بالنسبة لأولئك الذين يعانون من عدم تحمل اللاكتوز. تعرف على كيف يمكن أن يؤثر اضطراب الجهاز الهضمي على أحلامك.
23-05-2025
آبل تخطط لإطلاق نظارات ذكية في 2026 وتلغي ساعة ذكية بكاميرا
تستعد آبل لإطلاق نظارات ذكية بحلول 2026، بينما ألغت خططها لإنتاج ساعة ذكية بكاميرا. تعرف على تفاصيل المشروع وتوجهات الشركة نحو الذكاء الاصطناعي.
23-07-2025
غارات ميتا بقيمة 100 مليون دولار: استقطاب أفضل العقول في مجال الذكاء الاصطناعي من OpenAI
ورد أن شركة Meta Platforms تقدم حوافز مالية غير مسبوقة، تصل إلى 100 مليون دولار، لاقتناص كبار باحثي الذكاء الاصطناعي من OpenAI، مما يسرع طموحاتها في مجال الذكاء الاصطناعي العام (AGI) ويتحدى منافستها.
ADVERTISEMENT
28-07-2025
كرَنشي رول تضيء الشاشة الكبيرة ببرنامجها الشهري "ليالي الأنمي"
تعلن كرانشي رول عن "ليالي الأنمي"، برنامج شهري جديد يجلب أفلام وحلقات الأنمي إلى دور السينما في جميع أنحاء الولايات المتحدة، ابتداءً من أكتوبر.
08-09-2025
تسريبات آيفون 17 تلمح إلى فيديو بدقة 8K، وطراز "إير" جديد قبيل الإطلاق
تسريبات لمواصفات تشكيلة آيفون 17 تكشف عن إمكانية تسجيل فيديو بدقة 8K لطرازات Pro وإدخال نسخة "آيفون 17 إير"، وذلك قبل الإعلان الرسمي من آبل.
04-07-2025
الروبوتات البشرية التكيفية: إحداث ثورة في أرضية المصنع
اكتشف كيف أن الروبوتات البشرية الجديدة ذات قدرات التعلم أثناء العمل مهيأة لتحويل أرضيات المصانع، وتعزيز الكفاءة والقدرة على التكيف في التصنيع.
ADVERTISEMENT
09-07-2025
روبوت Optimus من Tesla سيكتسب دماغًا بفضل تكامل Grok من xAI
تقوم Tesla بدمج Grok AI الخاص بـ xAI في روبوتها البشري Optimus، مما يمنحه فهمًا متقدمًا للغة الطبيعية وقدرات استدلالية. تهدف هذه الخطوة إلى إنشاء روبوت بشري متعدد الأغراض حقًا وتسلط الضوء على تعاون أعمق بين Tesla و xAI.
18-07-2025
ساعة Pixel Watch 4: قفزة نحو قابلية الإصلاح والاستدامة
يشاع أن ساعة Pixel Watch 4 القادمة ستكون قابلة للإصلاح، وهو تغيير كبير عن النماذج السابقة التي كانت عرضة لأن تصبح نفايات إلكترونية في حالة تلفها. يتماشى هذا التحول مع أهداف Google للاستدامة.
04-09-2025
إنستغرام يصل أخيرًا إلى أجهزة الآيباد بعد 15 عامًا من الإهمال
إنستغرام تطلق تطبيقها الأصلي للآيباد بعد 15 عامًا، مقدمة تجربة ملء الشاشة وميزات جديدة مثل واجهة تركز على ريلز وتحسين فرز الخلاصة.
ADVERTISEMENT
09-06-2025
الروبوت البشري مقطوع الرأس "كالفين" ينضم إلى القوى العاملة في مصنع رينو
اكتشف كيف سيغير روبوت Wandercraft البشري بلا رأس، كالفن، الذي تم بناؤه في 40 يومًا فقط، التصنيع في مصانع رينو من خلال تولي المهام الشاقة وزيادة الإنتاجية.
30-05-2025
نماذج الذكاء الاصطناعي الأصغر: فرصة كبرى للشرق الأوسط
تستكشف المقالة كيف يمكن لنماذج الذكاء الاصطناعي الأصغر أن تفتح فرصًا أكبر لدول مجلس التعاون الخليجي، وتحول المنطقة إلى مركز عالمي للبنية التحتية للذكاء الاصطناعي.
23-06-2025
بيربلكسيتي إيه آي: المنافس الذي تبلغ قيمته 14 مليار دولار لإمبراطورية جوجل للبحث
تتحدى Perplexity AI، التي تبلغ قيمتها 14 مليار دولار، هيمنة جوجل على البحث، وتجذب اهتمام أبل وميتا على الرغم من المخاوف بشأن مصادر المحتوى الخاصة بها.
ADVERTISEMENT