يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

·

19/08/2025

ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

يمكن لـ Claude AI الآن إنهاء المحادثات الضارة أو المسيئة بشكل مستمر.
هذه الميزة هي إجراء أمان تجريبي لنماذج Claude Opus 4 و 4.1.
الذكاء الاصطناعي مبرمج لقطع الحوارات بعد طلبات ضارة متكررة ومحاولات فاشلة لإعادة التوجيه.
هذه الخطوة جزء من مبادرة أنثروبيك "رفاهية النموذج"، التي تركز على حماية أنظمة الذكاء الاصطناعي.
يُطلب من الذكاء الاصطناعي عدم إنهاء المحادثات في حالات الخطر الوشيك لإيذاء النفس أو إيذاء الآخرين.

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

مفاجأة لمستخدمي Windows 11: رنة Vista الشهيرة تعود عن طريق الخطأ

استبدلت مايكروسوفت عن طريق الخطأ صوت بدء تشغيل ويندوز 11 بنغمة ويندوز فيستا الكلاسيكية في إصدار تجريبي حديث من Insider Preview، وهو خلل مؤقت سيتم إصلاحه.

ADVERTISEMENT

أندرويد 16 يطلق أربع ترقيات مجانية رئيسية لهاتفك

اكتشف الترقيات المجانية الأربع الرئيسية القادمة لهواتف Android مع إصدار Android 16، مما يعزز الأمان والإنتاجية وتجربة المستخدم.

يوتيوب تتصدى لرد فعل عنيف من المبدعين بسبب تعديلات الفيديو المزعومة بالذكاء الاصطناعي

تتصدى يوتيوب لمخاوف المبدعين بشأن تعديل الذكاء الاصطناعي لمقاطع فيديو Shorts، وتعلن عن خطط لميزة إلغاء الاشتراك وسط نقاشات حول الشفافية والأصالة.

جوجل قفزة مغناطيسية: بيكسل سناب يصل لسلسلة بيكسل 10

جوجل تكشف النقاب عن PixelSnap، نظامها الجديد للملحقات المغناطيسية لسلسلة Pixel 10، مما يوفر وظائف شبيهة بـ MagSafe مع الشواحن، والحوامل، والمزيد.

ADVERTISEMENT

الألبان قبل النوم: وصفة للكوابيس؟

تشير دراسة جديدة إلى وجود صلة بين تناول منتجات الألبان قبل النوم وتجربة الكوابيس، خاصة بالنسبة لأولئك الذين يعانون من عدم تحمل اللاكتوز. تعرف على كيف يمكن أن يؤثر اضطراب الجهاز الهضمي على أحلامك.

آبل تخطط لإطلاق نظارات ذكية في 2026 وتلغي ساعة ذكية بكاميرا

تستعد آبل لإطلاق نظارات ذكية بحلول 2026، بينما ألغت خططها لإنتاج ساعة ذكية بكاميرا. تعرف على تفاصيل المشروع وتوجهات الشركة نحو الذكاء الاصطناعي.

غارات ميتا بقيمة 100 مليون دولار: استقطاب أفضل العقول في مجال الذكاء الاصطناعي من OpenAI

ورد أن شركة Meta Platforms تقدم حوافز مالية غير مسبوقة، تصل إلى 100 مليون دولار، لاقتناص كبار باحثي الذكاء الاصطناعي من OpenAI، مما يسرع طموحاتها في مجال الذكاء الاصطناعي العام (AGI) ويتحدى منافستها.

ADVERTISEMENT

كرَنشي رول تضيء الشاشة الكبيرة ببرنامجها الشهري "ليالي الأنمي"

تعلن كرانشي رول عن "ليالي الأنمي"، برنامج شهري جديد يجلب أفلام وحلقات الأنمي إلى دور السينما في جميع أنحاء الولايات المتحدة، ابتداءً من أكتوبر.

تسريبات آيفون 17 تلمح إلى فيديو بدقة 8K، وطراز "إير" جديد قبيل الإطلاق

تسريبات لمواصفات تشكيلة آيفون 17 تكشف عن إمكانية تسجيل فيديو بدقة 8K لطرازات Pro وإدخال نسخة "آيفون 17 إير"، وذلك قبل الإعلان الرسمي من آبل.

الروبوتات البشرية التكيفية: إحداث ثورة في أرضية المصنع

اكتشف كيف أن الروبوتات البشرية الجديدة ذات قدرات التعلم أثناء العمل مهيأة لتحويل أرضيات المصانع، وتعزيز الكفاءة والقدرة على التكيف في التصنيع.

ADVERTISEMENT

روبوت Optimus من Tesla سيكتسب دماغًا بفضل تكامل Grok من xAI

تقوم Tesla بدمج Grok AI الخاص بـ xAI في روبوتها البشري Optimus، مما يمنحه فهمًا متقدمًا للغة الطبيعية وقدرات استدلالية. تهدف هذه الخطوة إلى إنشاء روبوت بشري متعدد الأغراض حقًا وتسلط الضوء على تعاون أعمق بين Tesla و xAI.

ساعة Pixel Watch 4: قفزة نحو قابلية الإصلاح والاستدامة

يشاع أن ساعة Pixel Watch 4 القادمة ستكون قابلة للإصلاح، وهو تغيير كبير عن النماذج السابقة التي كانت عرضة لأن تصبح نفايات إلكترونية في حالة تلفها. يتماشى هذا التحول مع أهداف Google للاستدامة.

إنستغرام يصل أخيرًا إلى أجهزة الآيباد بعد 15 عامًا من الإهمال

إنستغرام تطلق تطبيقها الأصلي للآيباد بعد 15 عامًا، مقدمة تجربة ملء الشاشة وميزات جديدة مثل واجهة تركز على ريلز وتحسين فرز الخلاصة.

ADVERTISEMENT

الروبوت البشري مقطوع الرأس "كالفين" ينضم إلى القوى العاملة في مصنع رينو

اكتشف كيف سيغير روبوت Wandercraft البشري بلا رأس، كالفن، الذي تم بناؤه في 40 يومًا فقط، التصنيع في مصانع رينو من خلال تولي المهام الشاقة وزيادة الإنتاجية.

نماذج الذكاء الاصطناعي الأصغر: فرصة كبرى للشرق الأوسط

تستكشف المقالة كيف يمكن لنماذج الذكاء الاصطناعي الأصغر أن تفتح فرصًا أكبر لدول مجلس التعاون الخليجي، وتحول المنطقة إلى مركز عالمي للبنية التحتية للذكاء الاصطناعي.

بيربلكسيتي إيه آي: المنافس الذي تبلغ قيمته 14 مليار دولار لإمبراطورية جوجل للبحث

تتحدى Perplexity AI، التي تبلغ قيمتها 14 مليار دولار، هيمنة جوجل على البحث، وتجذب اهتمام أبل وميتا على الرغم من المخاوف بشأن مصادر المحتوى الخاصة بها.

ADVERTISEMENT