تُحدَّث يومياً

مصدرُك العربي
لمستقبل الذكاء الاصطناعي

أخبار، تقارير، أدوات وتحليلات يومية — كل ما تحتاجه لمتابعة ثورة الذكاء الاصطناعي باللغة العربية

✅ تم الاشتراك!
اختيار المحررينتعلم و استخدام الذكاء الاصطناعي

JetBrains تطلق نموذج Mellum2 المفتوح بـ 12 مليار معامل للبرمجة

🎧 استمع للملخص

بقلم: ليلى | محررة أدوات المطورين · صوت تحريري بإشراف بشري

طرحت شركة JetBrains نموذج Mellum2، وهو نموذج مفتوح المصدر بتقنية Mixture-of-Experts يضم 12 مليار معامل مُدرب من الصفر على النصوص الطبيعية والأكواد البرمجية، مع تفعيل 2.5 مليار معامل فقط لكل token مما يجعله أسرع بضعفين من النماذج المشابهة في الاستنتاج.

جدول مقارنة أداء نموذج Mellum2 مع النماذج المماثلة في معايير البرمجة والذكاء
مقارنة أداء Mellum2 مع النماذج الأخرى في اختبارات البرمجة والذكاء

النموذج الجديد يستهدف المهام عالية التردد منخفضة التأخير في أنظمة الذكاء الاصطناعي المركبة، حيث تعتمد الأنظمة الحديثة على استدعاءات متعددة للنماذج: التوجيه، الاسترجاع، التلخيص، التخطيط، التحقق، واستخدام الأدوات. هذه العمليات حساسة للوقت ولا تحتاج أكبر النماذج المتاحة.

أظهر Mellum2 أداء تنافسي مع النماذج المفتوحة المماثلة الحجم في معايير توليد الأكواد والاستدلال والعلوم والرياضيات، مع تحقيق سرعة استنتاج أكثر من الضعف، مما يجعله مناسباً لأحمال العمل الإنتاجية عالية الإنتاجية (وفقاً للتقرير الفني).

تركز JetBrains على جعل Mellum2 متخصص في النصوص والأكواد بدلاً من المهام متعددة الوسائط، مما يحافظ على كفاءة النموذج وملائمته لأحمال عمل هندسة البرمجيات. هذا التخصص يقلل حجم النموذج ويحسن كفاءته للمهام البرمجية المحددة.

  1. التوجيه والتنسيق: يعمل كنموذج خفيف للتوجيه في الأنظمة متعددة النماذج، تشمل تصنيف المحث والتحكم في التدفق الوسيط
  2. خطوط RAG: مناسب للاستعلامات حساسة الوقت مع ضغط السياق والتلخيص ومعالجة ما بعد الاسترجاع
  3. الوكلاء الفرعية: يمكن استخدامه للمهام الفرعية مثل التخطيط والتحقق والتحويل وإعداد السياق
  4. النشر الخاص: كونه مفتوح المصدر وفعال في الخدمة، يمكن نشره في البيئات المستضافة ذاتياً للأكواد المملوكة
  5. ميزات البرمجة عالية الإنتاجية: متكامل مع بيئات التطوير المتكاملة وأنظمة الأتمتة البرمجية

فلسفة الشركة تتجه نحو النماذج المتخصصة بدلاً من النماذج الأحادية الضخمة. أنظمة الإنتاج الفعالة تحتاج مكونات متخصصة متعددة: مُستخرِجات، موجهات، نماذج واعية بالأكواد، مُحققات، واستدعاء أدوات، ونماذج استدلال أكبر. Mellum2 هو نموذج “محوري” سريع ومحدد النطاق لتسريع الأنظمة وتقليل التكلفة وتسهيل التحكم.

النموذج متاح تحت رخصة Apache 2.0 عبر Hugging Face مع التوثيق الكامل والمعايير في التقرير الفني المفصل، مما يتيح للمطورين البدء فوراً في دمجه مع أنظمة الذكاء الاصطناعي الخاصة بهم.

Hugging Face Blog

مقالات ذات صلة

زر الذهاب إلى الأعلى