llama.cpp b9571 تعطيل نسخ متعددة ومشاكل دعم المنصات

🎧 استمع للملخص

بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري

واجه الإصدار الجديد b9571 من llama.cpp تحديات تقنية أدت إلى تعطيل 7 نسخ من أصل 27 نسخة مخططة، بينما نجح في إصلاح خطأ حرج في دعم وحدات معالجة الرسوميات من نفيديا.

التحديث الرئيسي يتمثل في إزالة حالة GGML_TYPE_Q4_K في ملف mvvq.cu (وفقاً لـ GitHub GGML)، وهو إصلاح يحل مشكلة في التعامل مع نوع الكمّية Q4_K المستخدم لضغط النماذج. هذا النوع من الأخطاء كان يسبب عدم استقرار في الأداء عند استخدام وحدات CUDA للتسريع.

لكن الإصدار شهد تعطيل نسخ مهمة، تشمل macOS Apple Silicon مع KleidiAI وجميع نسخ SYCL لأوبونتو وويندوز، بالإضافة إلى تعطيل كامل لدعم openEuler الذي كان يوفر 4 نسخ مختلفة. هذه التعطيلات تشير إلى مشاكل عميقة في التوافق مع هذه التقنيات تتطلب حلولاً جذرية.

النسخ المتاحة حالياً تغطي المنصات الأساسية: macOS (Intel وApple Silicon العادي)، Ubuntu مع دعم CPU وVulkan وROCm وOpenVINO، ويندوز مع دعم CUDA 12 وCUDA 13 وVulkan وHIP، بالإضافة إلى Android arm64 ونسخة واجهة المستخدم العامة.

للمطورين الذين يعتمدون على KleidiAI أو SYCL في مشاريعهم، هذا التعطيل يعني البحث عن بدائل مؤقتة أو العودة للإصدارات السابقة حتى حل المشاكل التقنية. أما مستخدمو وحدات CUDA فسيلاحظون تحسناً في الاستقرار، خاصة عند العمل مع النماذج المضغوطة بتقنية Q4_K.

الوضع الحالي يعكس التحديات التي تواجه مطوري المكتبات مفتوحة المصدر في دعم التنوع الهائل لمنصات الأجهزة والبرمجيات، خاصة مع السرعة المتزايدة في تطور تقنيات التسريع الجديدة مثل KleidiAI من ARM.

GitHub GGML