llama.cpp الإصدار b9294 بـ26 نسخة لجميع المنصات

🎧 استمع للملخص

بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري

نشر مشروع llama.cpp إصداره الجديد b9294 مع تركيز خاص على تحسين kernels معالجة نماذج Mixture of Experts على رقائق Qualcomm Adreno عبر OpenCL. الإصدار يضم 26 نسخة مختلفة تغطي كل منصة حاسوبية رئيسية من macOS إلى openEuler المؤسسي.

التحديث الأساسي يستهدف رقائق Adreno المستخدمة في معالجات Snapdragon، مما قد يحسّن بشكل ملحوظ أداء النماذج المعقدة على الأجهزة المحمولة. هذا التطوير جزء من استراتيجية أوسع لجعل تشغيل النماذج اللغوية الكبيرة محلياً أكثر كفاءة عبر طيف واسع من الأجهزة.

macOS Apple Silicon – نسختان: العادية والمحسّنة بـ KleidiAI، بالإضافة لنسخة Intel x64 منفصلة
iOS XCFramework – حزمة مطوري التطبيقات الأصلية مع دعم كامل للنماذج المحلية
Linux Ubuntu الشامل – 9 إصدارات تشمل CPU و Vulkan و ROCm 7.2 و OpenVINO و SYCL بدقتي FP32/FP16
Android arm64 – نسخة محسّنة خصيصاً للهواتف الذكية والأجهزة اللوحية
Windows المتكامل – 6 إصدارات بدعم CUDA 12/13 و Vulkan و SYCL و HIP مع مكتبات DLL منفصلة
openEuler المؤسسي – 4 إصدارات متخصصة لمعالجات 310p و 910b مع دعم ACL Graph للبيئات الصناعية

التنوع الهائل في الإصدارات يعكس نضج النظام البيئي لـ llama.cpp وقدرته على التكيف مع احتياجات مختلفة – من المطورين الأفراد على macOS إلى الشركات التي تستخدم openEuler في مراكز البيانات. دعم رقائق Adreno تحديداً يفتح إمكانيات جديدة للتطبيقات المحمولة التي تعتمد على نماذج معقدة دون الحاجة للاتصال بالخوادم السحابية.

ما لا يوضحه الإعلان هو مقدار التحسن في الأداء على رقائق Adreno، أو ما إذا كانت هذه التحسينات تأتي على حساب استهلاك الطاقة. المطورون سيحتاجون لاختبارات عملية لمعرفة تأثير هذه التحديثات على تجربة المستخدم النهائي.

GitHub