
بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري
أصدرت مؤسسة ggml النسخة b9534 من محرك تشغيل النماذج اللغوية llama.cpp مع مجموعة شاملة من التحديثات التقنية والإصدارات المُحضّرة مسبقاً. يركز هذا الإطلاق على توسيع دعم الأجهزة وحل مشاكل التوافق عبر المنصات المختلفة، مع تحسينات خاصة لمعالجات الرسوميات من إنتل.
- macOS Apple Silicon (arm64): تحميل مباشر مع تعطيل مؤقت لإصدار KleidiAI
- macOS Intel (x64): نسخة محسنة للمعالجات التقليدية
- iOS XCFramework: حزمة تطوير iOS للتطبيقات المحمولة
- Ubuntu متعدد المعماريات: دعم x64 وarm64 وs390x مع إصدارات CPU وVulkan وROCm 7.2 وOpenVINO 2026.0
- Android arm64: إصدار محسن للهواتف الذكية
- Windows شامل: دعم CUDA 12.4 وCUDA 13.3 مع ملفات DLL منفصلة، Vulkan، وHIP لكروت AMD
- واجهة المستخدم: حزمة UI منفصلة لسهولة الاستخدام
التحسين الأبرز في هذا الإصدار يتمثل في إضافة دعم Fast Walsh-Hadamard Transform (FWHT) لمعالجات إنتل مع تحسين استخدام الذاكرة المشتركة في بيئة Vulkan (وفقاً للمطورين). هذا التطوير يهدف إلى تسريع العمليات الحسابية على GPU من إنتل، لكن المطورين واجهوا تحدياً تقنياً أدى إلى تعطيل مؤقت لمُظلل FWHT على نظام ويندوز بسبب خطأ في تعريف إنتل.
ما يلفت الانتباه هو تعطيل عدة إصدارات مؤقتاً، بما في ذلك macOS Apple Silicon مع KleidiAI وWindows x64 مع SYCL وجميع إصدارات openEuler. هذه القرارات تعكس التحديات المستمرة في تطوير محرك يدعم تنوعاً هائلاً من الأجهزة والأنظمة. المطورون أيضاً عطلوا ميزة subgroup shuffle على MoltenVK AMD لتجنب مشاكل التوافق، مما يظهر النهج الحذر في ضمان الاستقرار.
للمطورين الذين يسعون لتشغيل النماذج اللغوية محلياً، يوفر هذا الإصدار خيارات واسعة تشمل تسارع CUDA بإصدارين مختلفين، دعم Vulkan عبر منصات متعددة، وتحسينات خاصة لمعالجات AMD عبر ROCm وHIP. لكن عليك توقع بعض التجريب للعثور على الإعدادات المثلى لجهازك، خاصة مع الإصدارات المعطلة مؤقتاً التي قد تعود في التحديثات القادمة.







