تُحدَّث يومياً

مصدرُك العربي
لمستقبل الذكاء الاصطناعي

أخبار، تقارير، أدوات وتحليلات يومية — كل ما تحتاجه لمتابعة ثورة الذكاء الاصطناعي باللغة العربية

✅ تم الاشتراك!
تعلم و استخدام الذكاء الاصطناعي

llama.cpp b9585 يحل مشكلة embedding scale في نماذج Granite Speech

🎧 استمع للملخص

بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري

تصدر ggml-org الإصدار b9585 من مكتبة llama.cpp بإصلاح تقني حاسم لنماذج Granite Speech. المشكلة الأساسية كانت في تطبيق مقياس التضمين (embedding scale) عند عدم استخدام تقنية deepstack، مما تسبب في أخطاء الاستدلال وتدهور أداء معالجة الكلام.

الإصلاح يستهدف تحديداً السيناريوهات التي لا تعتمد على deepstack – وهي حالات شائعة في التطبيقات المحلية البسيطة. بدون هذا التصحيح، كانت نماذج Granite Speech تنتج نتائج غير دقيقة أو معطوبة في بيئات التشغيل المحلي. يتضمن التحديث أيضاً تنظيف الكود بإزالة مراجع خاطئة لنموذج hunyuan-vl من ملفات الاختبار.

يأتي الإصدار مع 18 حزمة تنفيذ مختلفة موزعة على المنصات الرئيسية:

  1. macOS: Apple Silicon (arm64) و Intel (x64) مع تعطيل مؤقت لتقنية KleidiAI
  2. iOS: إطار عمل XCFramework للتطبيقات المحمولة
  3. Linux Ubuntu: معالجات x64 و arm64 و s390x، مع نسخ محسنة لـ Vulkan و ROCm 7.2 و OpenVINO 2026.0
  4. Android: معمارية arm64 للأجهزة المحمولة
  5. Windows: معالجات x64 و arm64، إصدارات CUDA 12.4 و 13.3، Vulkan، و HIP Radeon
  6. واجهة التحكم: حزمة UI منفصلة للتفاعل المباشر

بعض الإصدارات متوقفة مؤقتاً بسبب مشاكل تقنية – تشمل SYCL لكل من Ubuntu و Windows، وجميع إصدارات openEuler. هذا يعكس نهج المطورين في التركيز على الجودة بدلاً من الكمية.

للمطورين الذين اعتمدوا على نماذج Granite Speech في التطبيقات المحلية، هذا التحديث أساسي لضمان دقة النتائج. يمكن تحميل الإصدار مباشرة واختيار الحزمة المناسبة لبيئة التطوير الخاصة بك. المشكلة التي يحلها هذا الإصدار كانت تؤثر فقط على استخدامات deepstack المعطلة – لكنها تمثل نسبة كبيرة من حالات الاستخدام الفعلية.

GitHub

مقالات ذات صلة

زر الذهاب إلى الأعلى