LLaMA.cpp تطبيق موحد - 22 إصدار لجميع المنصات

بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري

تطوير جذري في LLaMA.cpp الإصدار b9253 يحل مشكلة تشتت الأدوات التي واجهت المطورين لشهور. أدريان جالويت من Hugging Face قاد جهد دمج جميع وظائف المكتبة في تطبيق “llama” واحد موحد، منهياً الحاجة للتنقل بين ملفات تنفيذية متعددة لكل مهمة.

الخبر الأهم هو توفر 22 إصداراً مختلفاً يغطي كل منصة تطوير تقريباً، من macOS بمعالجاته الجديدة إلى البيئات المؤسسية الصينية عبر openEuler:

macOS – 3 إصدارات: Apple Silicon العادي، Apple Silicon مع KleidiAI المحسن، و Intel x64 للأجهزة القديمة، بالإضافة لـ iOS XCFramework
Linux Ubuntu – 8 إصدارات متخصصة: CPU للمعمارات x64 وarm64 وs390x، Vulkan للرسوميات، ROCm 7.2 لبطاقات AMD، OpenVINO 2026.0 للذكاء الاصطناعي، وSYCL بدقتي FP32 وFP16
Windows – 6 إصدارات: CPU للمعمارات x64 وarm64، CUDA 12.4 وCUDA 13.1 مع DLLs منفصلة، Vulkan، SYCL، وHIP لبطاقات Radeon
Android – إصدار arm64 محسن للهواتف والأجهزة اللوحية
openEuler – 4 إصدارات للبيئات المؤسسية: معالجات 310p للمعمارات x86 وaarch64، ومعالجات 910b مع ACL Graph للمعمارتين

التطبيق الموحد يستبدل الأوامر المنفصلة مثل llama-server وllama-cli بواجهة “llama” واحدة مع أوامر فرعية. أمر “serve” يشغل الخادم، بينما “help” يعرض التعليمات الكاملة. هذا التصميم يحاكي أدوات حديثة مثل git وdocker التي تجمع وظائف متعددة تحت أمر رئيسي واحد.

الإصدارات المتعددة لكل منصة تحل مشكلة التوافق مع مسرعات الأجهزة المختلفة. CUDA 12 وCUDA 13 يلبيان احتياجات كروت NVIDIA الحديثة والقديمة، بينما ROCm يدعم كروت AMD الاحترافية. تقنية KleidiAI الجديدة على macOS تحسن أداء معالجات Apple Silicon بشكل ملحوظ.

المفاجأة الحقيقية هي دعم openEuler، نظام التشغيل الصيني الذي تدعمه Huawei. الإصدارات الأربعة تستهدف معالجات Ascend 310p و910b المتخصصة في الذكاء الاصطناعي، مما يفتح LLaMA.cpp أمام السوق الصينية المحلية.

رغم التبسيط الظاهري، المطورون المعتادون على الأدوات المنفصلة سيحتاجون تعديل سكريبتات البناء والنشر الخاصة بهم. الوثائق الحالية لا تذكر خطة للتوافق العكسي مع الأوامر القديمة.

GitHub