llama.cpp b9585 يصلح embedding scale لنماذج Granite Speech

🎧 استمع للملخص

بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري

تصدر ggml-org الإصدار b9585 من مكتبة llama.cpp بإصلاح تقني حاسم لنماذج Granite Speech. المشكلة الأساسية كانت في تطبيق مقياس التضمين (embedding scale) عند عدم استخدام تقنية deepstack، مما تسبب في أخطاء الاستدلال وتدهور أداء معالجة الكلام.

الإصلاح يستهدف تحديداً السيناريوهات التي لا تعتمد على deepstack – وهي حالات شائعة في التطبيقات المحلية البسيطة. بدون هذا التصحيح، كانت نماذج Granite Speech تنتج نتائج غير دقيقة أو معطوبة في بيئات التشغيل المحلي. يتضمن التحديث أيضاً تنظيف الكود بإزالة مراجع خاطئة لنموذج hunyuan-vl من ملفات الاختبار.

يأتي الإصدار مع 18 حزمة تنفيذ مختلفة موزعة على المنصات الرئيسية:

macOS: Apple Silicon (arm64) و Intel (x64) مع تعطيل مؤقت لتقنية KleidiAI
iOS: إطار عمل XCFramework للتطبيقات المحمولة
Linux Ubuntu: معالجات x64 و arm64 و s390x، مع نسخ محسنة لـ Vulkan و ROCm 7.2 و OpenVINO 2026.0
Android: معمارية arm64 للأجهزة المحمولة
Windows: معالجات x64 و arm64، إصدارات CUDA 12.4 و 13.3، Vulkan، و HIP Radeon
واجهة التحكم: حزمة UI منفصلة للتفاعل المباشر

بعض الإصدارات متوقفة مؤقتاً بسبب مشاكل تقنية – تشمل SYCL لكل من Ubuntu و Windows، وجميع إصدارات openEuler. هذا يعكس نهج المطورين في التركيز على الجودة بدلاً من الكمية.

للمطورين الذين اعتمدوا على نماذج Granite Speech في التطبيقات المحلية، هذا التحديث أساسي لضمان دقة النتائج. يمكن تحميل الإصدار مباشرة واختيار الحزمة المناسبة لبيئة التطوير الخاصة بك. المشكلة التي يحلها هذا الإصدار كانت تؤثر فقط على استخدامات deepstack المعطلة – لكنها تمثل نسبة كبيرة من حالات الاستخدام الفعلية.

GitHub