إصدار Llama.cpp b9637 يدعم Cohere2MoE

🎧 استمع للملخص

بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري

طرح مطورو ggml-org الإصدار b9637 من محرك Llama.cpp مع إضافة جوهرية: محلل مخصص لنماذج Cohere2MoE المعروفة باسم North Code، مما يجعل هذه النماذج المتقدمة متاحة للتشغيل المحلي لأول مرة في هذا المحرك الشائع.

التحديث الرئيسي يركز على دعم Mixture of Experts من Cohere، وهي تقنية تستخدم شبكة من النماذج المتخصصة لتحسين الأداء والكفاءة. هذا يعني أن المطورين العرب يمكنهم الآن تشغيل نماذج North Code على خوادمهم الخاصة بدلاً من الاعتماد على APIs السحابية.

الإصدار الجديد متاح عبر 22 حزمة تنفيذية تغطي كل منصة تطوير رئيسية:

أنظمة Apple والمحمول:
– macOS Apple Silicon للمعالجات الحديثة
– macOS Intel x64 للأجهزة الأقدم
– iOS XCFramework لتطبيقات iPhone وiPad
– Android arm64 للهواتف الذكية

Linux والخوادم:
يقدم دعماً شاملاً لـ Ubuntu عبر معماريات x64 وarm64 وs390x، مع تسريع GPU عبر Vulkan وROCm 7.2 للبطاقات الرسومية AMD. كما يدعم OpenVINO 2026.0 للمعالجات Intel وSYCL بدقتي FP32 وFP16 للحوسبة المتوازية.

Windows المتكامل:
يشمل إصدارات CPU تقليدية للمعمارية x64 وarm64، بالإضافة لدعم GPU متقدم عبر CUDA 12.4 وCUDA 13.3 مع مكتبات DLL منفصلة، وVulkan للبطاقات الرسومية العامة، وSYCL وHIP لبطاقات AMD Radeon.

التطوير تضمن أيضاً إعادة تسمية بعض المكونات البرمجية “لإسعاد المطور CISC” كما ورد في ملاحظات الإصدار، مما يشير لتحسينات في بنية الكود الداخلية.

المحدودية الوحيدة تظهر في تعطيل مؤقت لدعم KleidiAI في macOS وجميع إصدارات openEuler (x86 وaarch64 مع معالجات 310p و910b)، حيث يعمل الفريق على حل مشاكل البناء.

هذا التوسع يضع Llama.cpp في موقع تنافسي أقوى أمام محركات التشغيل الأخرى، خاصة للمطورين الذين يحتاجون خصوصية كاملة للبيانات أو يعملون في بيئات منقطعة عن الإنترنت. نماذج Cohere2MoE تتميز بكفاءة عالية في المهام المعقدة، مما يجعل إتاحتها محلياً نقلة مهمة للمشاريع المتقدمة.

GitHub