llama.cpp b9534 متاح بـ17 إصداراً وتحسينات Intel

🎧 استمع للملخص

بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري

أصدرت مؤسسة ggml النسخة b9534 من محرك تشغيل النماذج اللغوية llama.cpp مع مجموعة شاملة من التحديثات التقنية والإصدارات المُحضّرة مسبقاً. يركز هذا الإطلاق على توسيع دعم الأجهزة وحل مشاكل التوافق عبر المنصات المختلفة، مع تحسينات خاصة لمعالجات الرسوميات من إنتل.

macOS Apple Silicon (arm64): تحميل مباشر مع تعطيل مؤقت لإصدار KleidiAI
macOS Intel (x64): نسخة محسنة للمعالجات التقليدية
iOS XCFramework: حزمة تطوير iOS للتطبيقات المحمولة
Ubuntu متعدد المعماريات: دعم x64 وarm64 وs390x مع إصدارات CPU وVulkan وROCm 7.2 وOpenVINO 2026.0
Android arm64: إصدار محسن للهواتف الذكية
Windows شامل: دعم CUDA 12.4 وCUDA 13.3 مع ملفات DLL منفصلة، Vulkan، وHIP لكروت AMD
واجهة المستخدم: حزمة UI منفصلة لسهولة الاستخدام

التحسين الأبرز في هذا الإصدار يتمثل في إضافة دعم Fast Walsh-Hadamard Transform (FWHT) لمعالجات إنتل مع تحسين استخدام الذاكرة المشتركة في بيئة Vulkan (وفقاً للمطورين). هذا التطوير يهدف إلى تسريع العمليات الحسابية على GPU من إنتل، لكن المطورين واجهوا تحدياً تقنياً أدى إلى تعطيل مؤقت لمُظلل FWHT على نظام ويندوز بسبب خطأ في تعريف إنتل.

ما يلفت الانتباه هو تعطيل عدة إصدارات مؤقتاً، بما في ذلك macOS Apple Silicon مع KleidiAI وWindows x64 مع SYCL وجميع إصدارات openEuler. هذه القرارات تعكس التحديات المستمرة في تطوير محرك يدعم تنوعاً هائلاً من الأجهزة والأنظمة. المطورون أيضاً عطلوا ميزة subgroup shuffle على MoltenVK AMD لتجنب مشاكل التوافق، مما يظهر النهج الحذر في ضمان الاستقرار.

للمطورين الذين يسعون لتشغيل النماذج اللغوية محلياً، يوفر هذا الإصدار خيارات واسعة تشمل تسارع CUDA بإصدارين مختلفين، دعم Vulkan عبر منصات متعددة، وتحسينات خاصة لمعالجات AMD عبر ROCm وHIP. لكن عليك توقع بعض التجريب للعثور على الإعدادات المثلى لجهازك، خاصة مع الإصدارات المعطلة مؤقتاً التي قد تعود في التحديثات القادمة.

ggml GitHub

llama.cpp b9534 متاح بـ17 إصداراً شاملاً وتحسينات Intel Vulkan

مقالات ذات صلة

مصدرُك العربيلمستقبل الذكاء الاصطناعي

مقالات ذات صلة

Lowfat يخفض فاتورة LLM بنسبة 91.8% عبر ترشيح CLI

vLLM v0.22.1 يضيف نموذج JetBrains وتسريع AMD ويصلح مشاكل DeepSeek-V4

مقالات ذات صلة

Kelet تكشف الأخطاء المخفية في تطبيقات الذكاء الاصطناعي وتُصلحها تلقائياً

Stripe تحضر المدفوعات لعصر الوكلاء الذكية بمحفظة Link الجديدة

مغذي الطيور الذكي Kiwibit يتعرف على 10 آلاف نوع بالذكاء الاصطناعي

باحثو كارنيجي ميلون يحلون معضلة استشعار القوة للروبوتات التجارية

مصدرُك العربي
لمستقبل الذكاء الاصطناعي