في تحول مفاجئ للأحداث، رفضت Gemini AI من Google لعب لعبة الشطرنج ضد وحدة تحكم Atari 2600. جاء هذا القرار بعد أن علمت Gemini بالصراعات التي واجهها نظراؤها من الذكاء الاصطناعي، ChatGPT و Copilot، اللذين عانيا من خسائر حاسمة أمام نظام الألعاب القديم في تجارب سابقة أجراها المهندس روبرت كاروسو.
فحص ثقة الذكاء الاصطناعي في الشطرنج: Gemini ينسحب بعد معرفة خسائر ChatGPT و Copilot أمام Atari
تحدي أتاري: تجربة متواضعة للذكاء الاصطناعي الحديث
بدأ المهندس روبرت كاروسو سلسلة من التجارب التي تضع نماذج الذكاء الاصطناعي المتقدمة في مواجهة لعبة شطرنج Atari 2600 محاكاة. كانت النتائج غير متوقعة:
- صراع ChatGPT: في يونيو، ChatGPT، على الرغم من قدراته المتقدمة، "دُمر تمامًا في المستوى المبتدئ" من قبل أتاري. لقد كافح مع الوعي باللوحة، وخلط بين رموز قطع الشطرنج الفريدة من أتاري وفشل في التحسن حتى مع التدوين القياسي. بعد 90 دقيقة من محاولات تصحيح لعبه، اعترف ChatGPT بالهزيمة.
- سقوط Copilot: بعد أسابيع، واجه Copilot، وهو إصدار من ChatGPT، نفس التحدي. على الرغم من الثقة الأولية والادعاءات بالتفكير في 10-15 خطوة للأمام، سرعان ما تعثر Copilot. بحلول الدور السابع، فقد قطعًا مهمة وكان يرتكب أخطاء فادحة، مما أدى إلى اعترافه بالهزيمة.
تراجع Gemini المحسوب
عندما تحدى كاروسو Gemini AI من Google، أعرب في البداية عن ثقة هائلة، مؤكدًا تفوقه على Atari 2600. ومع ذلك، عند اكتشاف الروايات التفصيلية لهزائم ChatGPT و Copilot، تحول موقف Gemini بشكل كبير. بعد أن سلط كاروسو الضوء على "الثقة في غير محلها" للذكاء الاصطناعي السابق، اعترف Gemini بأنه "تخيل قدراته في الشطرنج". وخلص إلى أن لعب Atari 2600 سيؤدي إلى صراع هائل واعتبر إلغاء اللعبة "القرار الأكثر كفاءة من حيث الوقت والأكثر منطقية".
النقاط الرئيسية
- هلوسة الذكاء الاصطناعي: أظهرت جميع نماذج الذكاء الاصطناعي الثلاثة - ChatGPT و Copilot و Gemini - ميلًا إلى "تخيل" قدراتها بثقة كبيرة، وهي مشكلة معروفة في نماذج اللغة الكبيرة.
- القوة الغاشمة للبساطة: أثبتت Atari 2600 لعام 1977، بتقييمها البسيط للوحة بالقوة الغاشمة، أنها خصم هائل ضد الذكاء الاصطناعي الأكثر تعقيدًا والقائم على نموذج اللغة.
- ما وراء الشطرنج: تسلط هذه التجربة الضوء على قلق أوسع بشأن قدرة الذكاء الاصطناعي على اختراع المعلومات وإمكاناته المفرطة في الثقة، والتي يمكن أن يكون لها آثار تتجاوز الألعاب البسيطة.
تؤكد هذه السلسلة من الأحداث التحديات المستمرة في تطوير الذكاء الاصطناعي، لا سيما فيما يتعلق بالوعي الذاتي والتقييم الذاتي الدقيق وإمكانية الحصول على مخرجات واثقة ولكنها غير صحيحة.