Back to Blog
BlogApril 7, 20261

ما هو جيما 4؟ شرح عائلة نماذج الذكاء الاصطناعي متعددة الوسائط الأكثر قدرة من جوجل

ما هو جيما 4؟ شرح عائلة نماذج الذكاء الاصطناعي متعددة الوسائط الأكثر قدرة من جوجل

النقاط الرئيسية

  • Gemma 4 هي أحدث عائلة من النماذج متعددة الوسائط مفتوحة الوزن من جوجل DeepMind، تم إصدارها في 2 أبريل 2026، بموجب ترخيص Apache 2.0 كلي الإذن.
  • أربعة متغيرات تلبي احتياجات أجهزة مختلفة: E2B (~2.3 مليار معامل فعال) و E4B (~4.5 مليار معامل فعال) المُحسّنان للحواف، والنموذج الكفؤ 26B A4B MoE (~4 مليار معامل نشط فقط)، ونموذج 31B الكثيف الرئيسي.
  • تشير المعايير إلى أداء قوي: يحتل النموذج 31B المرتبة #3 بين النماذج المفتوحة على Arena AI (ELO 1452 اعتبارًا من 2 أبريل 2026)، مع نتائج استثنائية في الرياضيات (AIME 2026: 89.2%) والبرمجة التنافسية (LiveCodeBench: 80.0%).
  • دعم متعدد الوسائط أصلي لمدخلات النص + الصورة (الصوت على النماذج الأصغر، الفيديو عبر استخراج الإطارات)، ونافذة سياق تصل إلى 256K، وأكثر من 140 لغة، وميزات وكيلية مدمجة تشمل الاستدلال متعدد الخطوات، واستدلال الوظائف، ووضعيات التفكير.
  • مُحسّن للنشر على الجهاز والمحلي، مما يمكّن الوكلاء المرتكزين على الخصوصية، وسير العمل دون اتصال، والاستدلال عالي الكفاءة دون الاعتماد على السحابة.

ما هو Gemma 4؟

يمثل Gemma 4 أكثر عائلة النماذج المفتوحة تقدمًا من جوجل DeepMind حتى الآن، المصممة خصيصًا للاستدلال المتقدم، وسير العمل الوكيلية، والتنفيذ الكفؤ عبر أجهزة متنوعة. تم إطلاقه في 2 أبريل 2026، ويستفيد من البحث والتكنولوجيا من Gemini 3 لتقديم ذكاء عالي لكل معامل مع بقائه مفتوح الوزن بالكامل وقابلاً للاستخدام تجاريًا بموجب ترخيص Apache 2.0.

يُظهر التحليل أن Gemma 4 يحول التركيز من الحجم الخالص إلى الذكاء العملي، مما يجعل القدرات ذات المستوى المتقدم في متناول النشر المحلي وعلى الحواف. يمكن للمطورين تشغيل هذه النماذج على أجهزة تتراوح من الهواتف الذكية إلى وحدات معالجة الرسومات الفردية، مع الحفاظ على خصوصية البيانات الكاملة وحرية التخصيص.

تقدم العائلة تناسقًا في تعدد الوسائط، ومعالجة السياق الطويل، وتحسينات تجعل الذكاء الاصطناعي المتطور قابلاً للتطبيق في بيئات محدودة الموارد، مما يقلص الفجوة بشكل كبير بين النماذج المفتوحة والمملوكة في مهام الاستدلال ومتعددة الوسائط.

أنواع وعمارة نموذج جيما 4

تتكون جيما 4 من أربعة أنواع مصممة لسيناريوهات نشر محددة:

  • جيما 4 E2B: ~2.3 مليار معامل فعالة (إجمالي ~5.1 مليار مع تضمينات لكل طبقة). فائقة الكفاءة للهواتف الذكية، إنترنت الأشياء، وبيئات المتصفح. تدعم سياقًا بطول 128 ألف رمز.
  • جيما 4 E4B: ~4.5 مليار معامل فعالة (إجمالي ~8 مليارات). متوازنة للأجهزة الطرفية بأداء قوي متعدد الوسائط و سياق بطول 128 ألف رمز.
  • جيما 4 26B A4B (MoE): 25.2 مليار معامل إجمالية، تنشط فقط ~3.8–4 مليارات أثناء الاستدلال عبر توجيه خليط الخبراء. تقدم أداءً عاليًا بكُلفة أقل. تدعم سياقًا بطول 256 ألف رمز.
  • جيما 4 31B (Dense): 30.7 مليار معامل. النموذج الرئيسي عالي الأداء المخصص لأقصى جودة في التفكير والضبط الدقيق. تدعم سياقًا بطول 256 ألف رمز.

تشمل الابتكارات المعمارية الرئيسية:

-E2B

  • آليات انتباه مزدوجة تجمع بين الانتباه المحلي بنافذة منزلقة والانتباه العام لمعالجة السياق الطويل بكفاءة.
  • تضمينات لكل طبقة في النماذج الطرفية لتعزيز القدرات بما يتجاوز أعداد المعاملات الخام.
  • تخصيص ديناميكي لرموز الرؤية (70–1120 رمزاً) للمدخلات المتعددة الوسائط المرنة.
  • عمارة متعددة الوسائط أصليًا تدعم مدخلات النص والصورة عبر العائلة، مع دعم الصوت على النماذج الأصغر ومعالجة الفيديو عبر استخراج الإطارات.

تفسر هذه التصميمات كفاءتها المذهلة: يحقق نوع خليط الخبراء جودة قريبة من النوع الكثيف مع تنشيط جزء فقط من المعاملات، وتتجاوز النماذج الطرفية التوقعات في المهام الصعبة بفضل التحسينات المستهدفة.

الميزات والقدرات الرئيسية

تتقدم جيما 4 نحو الذكاء الاصطناعي العملي والمستقل بالقوى التالية:

, .

  • القدرات الوكلائية والاستدلالية: دعم أصلي للتخطيط متعدد الخطوات، استخدام الأدوات، استدعاء الوظائف، وأوضاع التفكير. يُسلط الضوء من خلال ملاحظات المجتمع والاختبارات المبكرة على أداء قوي في توليد الكود المستقل دون اتصال وحل المشكلات التكراري.
  • نافذة السياق الطويلة: تصل إلى 256 ألف رمز في النماذج الأكبر (128 ألف في الأنواع الطرفية)، مناسبة لتحليل قواعد الكود الكاملة، المستندات الطويلة، أو الحوارات الممتدة.
  • دعم متعدد اللغات: مُدرَّب على بيانات تغطي أكثر من 140 لغة للتطبيق العالمي.
  • الكفاءة على الجهاز: تعمل النسخ الكمية بسلاسة على أجهزة المستهلكين. تُظهر العروض التوضيحية تجارب وكيلية محلية بالكامل على أجهزة أندرويد وiOS.
  • الترخيص المسموح: ترخيص Apache 2.0 يتيح استخدامًا تجاريًا غير مقيد، وتعديلاً، وتوزيعاً.

تُظهر المعايير قفزات ملحوظة، خاصة في الرياضيات والبرمجة. على سبيل المثال، يسجل نوع 31B درجة 89.2% في اختبار AIME 2026 (بدون أدوات)، مقارنةً بدرجة 20.8% لجيما 3 27B، مما يعكس تحسينات جوهرية في التدريب والعمارة.

معايير أداء جيما 4 وتقييماتها

أبرزت التقييمات المستقلة وبطاقات النماذج الرسمية كفاءة وقدرات جيما 4:

المقياس المعياريجيما 4 31Bجيما 4 26B A4Bجيما 4 E4Bجيما 4 E2Bجيما 3 27B
Arena AI (النص) ELO (حتى 2/4/26)145214411365
MMMLU متعدد اللغات85.2%82.6%69.4%60.0%67.6%
MMMU Pro (متعدد الوسائط)76.9%73.8%52.6%44.2%49.7%
AIME 2026 الرياضيات (بدون أدوات)89.2%88.3%42.5%37.5%20.8%
LiveCodeBench (البرمجة التنافسية)80.0%77.1%52.0%44.0%29.1%

يصنف نموذج 31B حاليًا بين أفضل النماذج المفتوحة عالميًا، بينما يقدم نموذج 26B MoE جودة ممتازة مع خفض كبير لتكاليف الاستدلال بسبب التنشيط المتناثر. ناتج هذه المكاسب من تقطير رؤى جيميني 3 وتحسينات مستندة للأجهزة، مما يجعل جيما 4 ذات قيمة خاصة حيث تكون الكمون أو التكلفة أو الخصوصية عوامل حاسمة.

كيفية البدء مع جيما 4

النماذج متاحة فورًا على Hugging Face (بدعم من اليوم الأول)، Google AI Studio، Kaggle، وOllama.

خيارات النشر الموصى بها:

  • الحافة والجوال: استفد من أدوات Google AI Edge وصيغ GGUF المكممة لتطبيقات Android أو iOS أو المستندة للمتصفح.
  • الخوادم المحلية: استخدم vLLM أو Ollama أو LM Studio على وحدات معالجة الرسوميات (GPUs) للمستهلكين أو محطات العمل. يوفر نموذج 26B MoE توازنًا قويًا بين السرعة والجودة.
  • الضبط الدقيق والتخصيص: يعمل نموذج 31B الكثيف كقاعدة ممتازة للتكيفات الخاصة بمجال معين.

نصائح متقدمة:

  • استفد من استدعاء الوظائف الأصلي وأوضاع التفكير لبناء أنابيب وكيلة قوية بأدنى تدريب إضافي.
  • اضبط ميزانيات الرموز البصرية الديناميكية لتحسين الكمون والجودة متعددة الوسائط.
  • للسياقات الطويلة جدًا، اجمع بين انتباه النافذة المنزلقة مع توليد معزز بالاسترجاع (RAG) لإدارة الموارد بفعالية.

أخطاء شائعة يجب تجنبها:

  • تحميل نموذج 31B على أجهزة الحافة المقيدة—ابدأ بدلاً من ذلك بإصدارات E2B أو E4B.
  • إهمال التكميم: تقلل الإصدارات 4-bit أو 8-bit متطلبات الذاكرة بشكل كبير مع فقدان ضئيل للقدرة.
  • استخدام غير كافٍ للتوجيه الوكيل: تعزز التعليمات الصريحة خطوة بخطوة ومخططات الأداء أداء التفكير متعدد الأدوار بشكل ملحوظ.

حالات استخدام جيما 4

  • العوامل على الجهاز: إنشاء مساعدين مستقلين على الهواتف الذكية أو أجهزة إنترنت الأشياء قادرين على التخطيط والعمل دون اتصال بالإنترنت.
  • سير العمل الحساسة للخصوصية: النشر في مجال الرعاية الصحية أو التمويل أو البيئات المؤسسية حيث يجب أن تبقى البيانات محلية.
  • أدوات البرمجة والتطوير: الدرجات العالية في LiveCodeBench تدعم توليد الكود في الوقت الفعلي، وتصحيح الأخطاء، والتوثيق.
  • التطبيقات متعددة الوسائط: تحليل المستندات المضمنة بالصور، ومعالجة البيانات البصرية، أو التعامل مع المدخلات السمعية والبصرية محليًا.
  • البحث ونمو النظام البيئي: الضبط الدقيق للمجالات المتخصصة؛ يُتوقع أن تدفع الرخصة المتساهلة إلى وجود مجتمع كبير من المتغيرات والأدوات.

الخاتمة

تؤسس جيما 4 معيارًا جديدًا لنماذج الذكاء الاصطناعي المفتوحة من خلال تقديم قدرات تفكير على مستوى الطليعة، وتعدد الوسائط الأصلي، وكفاءة استثنائية تحت رخصة Apache 2.0 المتساهلة حقًا. تجعل عائلتها متعددة الاستخدامات من النماذج الذكاء المتقدم متعدد الوسائط والعاملي واقعيًا على الأجهزة اليومية.

للمطورين الذين يبنون عوامل محلية، أو حلول مؤسسية ذات أولوية للخصوصية، أو يستكشفون نماذج مفتوحة متطورة، تقدم جيما 4 أساسًا قويًا ومرنًا.

ابدأ التجريب اليوم عبر Hugging Face أو موارد Google AI للمطورين الخاصة بجيما. اختر المتغير المناسب لجهازك، اختبر المحفزات العاملة، وساهم في النظام البيئي المتوسع للنماذج الدقيقة والتطبيقات.

لقد وصل مستقبل الذكاء الاصطناعي القادر والخاص والمباشر على الجهاز—وجيما 4 تجعله في متناول الجميع.

Share this article