التكنولوجيا اليومية
·04/06/2026
يشهد مشهد الذكاء الاصطناعي تحولًا سريعًا من نماذج عملاقة حصرية على السحابة إلى نماذج قوية يمكن تشغيلها مباشرة على حاسوبك المحمول. ويجسد أحدث إصدار من Google، وهو Gemma 4 12B، هذا التطور، إذ يبرز الاتجاهات الرئيسية التي تجعل الذكاء الاصطناعي أكثر شخصية وكفاءة وتنوعًا. ويقدم هذا النموذج نافذة واضحة على مستقبل الذكاء الاصطناعي المتاح للجميع.
يتمثل الاتجاه الأهم في إتاحة الذكاء الاصطناعي عالي الأداء على نطاق أوسع. فالنماذج مثل Gemma 4 12B، التي تضم 12 مليار معلمة، تقدم قدرات كانت تقتصر سابقًا على نماذج أكبر بكثير، وتقترب من أداء نماذج بسعة 26 مليار معلمة. ويتيح ذلك تنفيذ الاستدلال المعقد متعدد الخطوات وسير العمل الوكيلي محليًا على حاسوب شخصي، وهي مهمة كانت في السابق حكرًا على مراكز البيانات الضخمة.
12B ≈ قدرة بمستوى 26B
يُبرز Gemma 4 12B كيف أن النماذج المحلية الأصغر تسد الفجوة مع الأنظمة الأكبر بكثير، مع بقائها عملية على الأجهزة الشخصية.
وتعزز القدرة على تشغيل ذكاء اصطناعي متطور من دون اتصال بالإنترنت خصوصية المستخدم، وتقلل الاعتماد على البنية التحتية السحابية، وتفتح إمكانات جديدة للتطبيقات المخصصة. ويمكن للمطورين الآن تنزيل أوزان النموذج مباشرة من منصات مثل Kaggle وHugging Face للبناء والتجريب وفق شروطهم الخاصة، مما يسرّع وتيرة الابتكار.
تُعد السرعة والكفاءة عنصرين أساسيين لتجربة استخدام سلسة في تطبيقات الذكاء الاصطناعي. ويقدم Gemma 4 12B ميزة التنبؤ متعدد الرموز (MTP) بوصفها خاصية قياسية. وتستخدم هذه التقنية المبتكرة دورات المعالجة التي كانت ستبقى غير مستغلة لحساب الكلمات أو «الرموز» المستقبلية المحتملة في التسلسل بصورة استباقية، ما يتيح للنموذج فعليًا أن يفكر مسبقًا.
ومن خلال التنبؤ بالرموز اللاحقة بينما لا يزال الرمز الحالي قيد المعالجة، يستطيع النموذج توليد الاستجابات بسرعة وكفاءة أكبر. وفي حين توجد نسخ اختيارية من MTP لنماذج أخرى في عائلة Gemma 4، فإن الإصدار 12B هو أول نموذج تأتي فيه هذه التقنية المعززة للأداء مدمجة بشكل افتراضي، واضعةً معيارًا جديدًا للاستجابة في الذكاء الاصطناعي المحلي.
يستفيد النموذج من السعة المعالجة التي كانت ستظل غير مستغلة أثناء توليد الرموز.
يقدّر بصورة استباقية الكلمات التالية المحتملة بينما لا يزال الرمز الحالي قيد المعالجة.
ولأن جزءًا من الخطوة التالية يُحضَّر مسبقًا، تصل الاستجابات بسرعة وكفاءة أفضل.
يحتاج الذكاء الاصطناعي الحديث إلى فهم ما هو أكثر من النصوص.
تتميز عائلة Gemma 4 بأنها متعددة الوسائط بطبيعتها، وقادرة على معالجة مدخلات النصوص والصور والصوت. ويقود نموذج 12B نهجًا أكثر انسيابية في التعامل مع هذا التحدي. فبدلًا من استخدام مرمِّزات منفصلة وضخمة للبيانات البصرية، يعتمد على وحدة تضمين مبسطة تدمج المعلومات البصرية مباشرة بزمن استجابة أقل.
والأكثر إثارة للإعجاب أنه يعالج الصوت عبر إسقاط الإشارة الخام في الفضاء المتجهي نفسه الذي يستخدمه النص، مما يلغي تمامًا الحاجة إلى مرمِّز صوتي مخصص. ويقلل هذا الاختراق التصميمي بشكل كبير من زمن الاستجابة واستهلاك الذاكرة، مما يجعل الذكاء الاصطناعي المتعدد الوسائط والمتطور عمليًا على الأجهزة الموجهة للمستهلكين وعلى نطاق أوسع من الأجهزة.









