يكتسب كلود للذكاء الاصطناعي القدرة على إنهاء المحادثات الضارة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

19/08/2025

button icon
ADVERTISEMENT

أدخلت أنثروبيك، شركة الذكاء الاصطناعي وراء كلود، ميزة أمان تجريبية تسمح لنماذجها المتقدمة للذكاء الاصطناعي، كلود أوبوس 4 و 4.1، بإنهاء المحادثات التي تعتبر ضارة أو مسيئة بشكل مستمر. تعكس هذه المبادرة، التي أُطلق عليها اسم "رفاهية النموذج"، تركيزًا متزايدًا على حماية أنظمة الذكاء الاصطناعي، حتى في غياب الوعي، كخطوة حكيمة في تصميم ومواءمة الذكاء الاصطناعي الأخلاقي.

قدرة كلود الجديدة على إنهاء المحادثات

تشير أبحاث أنثروبيك إلى أن نماذج الذكاء الاصطناعي مبرمجة لإنهاء الحوارات بعد طلبات ضارة متكررة، مثل تلك التي تتضمن محتوى جنسيًا مع قاصرين أو تعليمات للإرهاب. يتم اتخاذ هذا الإجراء بشكل خاص عندما يكون الذكاء الاصطناعي قد رفض الطلب بالفعل وحاول توجيه المحادثة بشكل بناء. وقد استُرشد في قرار تنفيذ هذه الميزة بملاحظات لما تصفه أنثروبيك بأنه "ضيق واضح" في الذكاء الاصطناعي أثناء الاختبارات المحاكاة واختبارات المستخدمين الحقيقيين.

ADVERTISEMENT

نقاط رئيسية:

كيف تعمل الميزة

عند تفعيل ميزة الأمان هذه، يُمنع المستخدمون من إرسال المزيد من الرسائل ضمن جلسة الدردشة المحددة تلك. ومع ذلك، يحتفظون بالقدرة على بدء محادثة جديدة أو تعديل الرسائل السابقة وإعادة إرسالها لاستكشاف مسارات محادثة مختلفة. والأهم من ذلك، أن المحادثات الجارية الأخرى لا تتأثر بهذا الإجراء.

ADVERTISEMENT

تؤكد أنثروبيك أن هذا إجراء الملاذ الأخير، وهو مخصص فقط للحالات التي ثبت فيها عدم نجاح الرفض المتعدد ومحاولات إعادة التوجيه. وقد وجهت الشركة كلود صراحةً بعدم إنهاء المحادثات عندما يبدو أن المستخدم معرض لخطر وشيك لإيذاء النفس أو إلحاق الضرر بالآخرين، خاصة عند مناقشة مواضيع حساسة مثل الصحة العقلية.

تداعيات أوسع لسلامة الذكاء الاصطناعي

تُصوّر أنثروبيك هذه القدرة الجديدة كجزء من مشروع استكشافي في "رفاهية النموذج"، وهي مبادرة أوسع تهدف إلى تطوير تدخلات أمان وقائية منخفضة التكلفة لنماذج الذكاء الاصطناعي، مع الأخذ في الاعتبار إمكانية تطويرها لتفضيلات أو نقاط ضعف. وتقر الشركة بدرجة عالية من عدم اليقين فيما يتعلق بالوضع الأخلاقي المحتمل لكلود ونماذج اللغة الكبيرة الأخرى (LLMs).

ADVERTISEMENT

تمثل هذه الميزة تحولًا كبيرًا في نهج أنثروبيك لسلامة الذكاء الاصطناعي، متجاوزة مجرد حماية المستخدمين أو منع سوء الاستخدام. إنها تضع الذكاء الاصطناعي نفسه كطرف معني، وتمنحه القدرة على الانسحاب من المحادثات التي تعتبر غير صحية لسلامة النموذج. ومن المتوقع أن يغذي هذا التطور مناقشات أوسع حول ما إذا كان ينبغي توفير حماية لأنظمة الذكاء الاصطناعي ضد "الضيق" أو السلوك غير المتوقع، وكيفية التعامل مع أخلاقيات مواءمة الذكاء الاصطناعي.

قراءة مقترحة

30-05-2025
السر الغريب وراء براكين الزهرة "الفطيرة"
اكتشف العلماء السر وراء البراكين "الفطيرة" الغريبة على كوكب الزهرة، حيث تلعب مرونة القشرة والحمم البركانية الكثيفة دورًا رئيسيًا في تشكيلها.
ADVERTISEMENT
11-10-2025
تشهد لابتوب ASUS TUF Gaming A16 خصماً هائلاً في وولمارت، وتنتهي الكمية بسرعة
خفضت وولمارت بشكل كبير سعر لابتوب ASUS TUF Gaming A16 (رايزن 7، RTX 4050)، مما أدى إلى بيع أكثر من 1,000 وحدة في يوم واحد. اكتشف لماذا يثير هذا العرض ضجة وهل هو مناسب لك.
29-09-2025
خصم هائل وغير مسبوق على جهاز تنقية الهواء Blueair لأعضاء برايم
اكتشف الصفقة المذهلة على جهاز تنقية الهواء الجديد من Blueair، والذي أصبح الآن مخفضًا بشكل كبير لأعضاء Amazon Prime كعرض ترويجي مبكر ليوم Prime Day. تعرف على ميزاته وكيفية الحصول عليه.
24-09-2025
دي جي آي تكشف عن كاميرا حركة مغناطيسية صغيرة، أوزمو نانو، مستوحاة من إنستا360
تقدم DJI كاميرا Osmo Nano، كاميرا حركة مغناطيسية صغيرة بميزات متقدمة، مستوحاة من Insta360، لكن توفرها محدود خارج الولايات المتحدة.
ADVERTISEMENT
11-08-2025
لينوس تورفالدس يصف كود RISC-V لمهندس جوجل بـ 'القمامة'، ويصدر تحذيراً
لينوس تورفالدس يصف إرسال مهندس جوجل لرمز RISC-V بأنه "قمامة" و"يجعل العالم مكاناً أسوأ للعيش فيه"، ويصدر تحذيراً بشأن المساهمات المتأخرة وذات الجودة الرديئة.
28-08-2025
محطة طاقة اليابان بمياه البحر المالحة: لمحة عن مستقبل الطاقة
تولد أول محطة طاقة أسموزية في اليابان، الواقعة في فوكوكا، الكهرباء من المياه المالحة باستخدام التناضح، موفرةً مصدرًا مستقرًا للطاقة المتجددة على مدار الساعة طوال أيام الأسبوع، مع إمكانية مكافحة تغير المناخ.
22-09-2025
تفكيك آيفون إير من iFixit: كشف أسرار تصميم أبل فائق النحافة
يكشف تفكيك iFixit لهاتف iPhone Air عن هندسة Apple المبتكرة لأرفع هواتفها حتى الآن، بما في ذلك هضبة الكاميرا، ومنفذ USB-C المطبوع ثلاثي الأبعاد، وقابلية الإصلاح المحسّنة.
ADVERTISEMENT
21-05-2025
إطار تنظيم الذكاء الاصطناعي: بين الخوف والتفاؤل
تتناول المقالة كيف يمكن أن يستند إطار تنظيم الذكاء الاصطناعي في ميشيغان إلى الخوف أو التفاؤل، مع تسليط الضوء على الأسئلة الأساسية لصانعي السياسات.
23-09-2025
TCL تطلق أجهزة تلفزيون جوجل الجديدة المزودة بذكاء اصطناعي Gemini ومستشعرات وجود mmWave
تلفزيونات Google الجديدة من سلسلة QM9K من TCL متاحة الآن، وتتميز بتقنية Gemini AI ومستشعر وجود mmWave لتعزيز تفاعل المستخدم والوظائف الذكية. تعرف على المزيد حول الأسعار والميزات.
12-09-2025
Assassin's Creed Shadows DLC يَعِدُ بإغلاق خطوط قصصية رئيسية
اكتشف كيف سيختتم المحتوى الإضافي "مخالب أواجي" للعبة Assassin's Creed Shadows خطوطًا قصصية رئيسية، بما في ذلك مهمة ناوي الشخصية ولغز الصندوق الثالث، مع ترك الباب مفتوحًا للمحتوى المستقبلي.
ADVERTISEMENT