
بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري
أصدر فريق LLaMA.cpp الإصدار b9279 الذي يجلب ثورة حقيقية في معالجة نماذج الصوت عبر دمج تفعيل Snake في محرك Vulkan، حيث يحول خمس عمليات منفصلة إلى نواة واحدة محسنة، مع توزيع الإصدار عبر 22 حزمة تشمل كافة الأنظمة من macOS إلى Android.
- إنشاء shader snake.comp متقدم: تطوير نواة جديدة تدعم أنواع البيانات F32 وF16 وBF16 مع pipelines مخصصة لكل نوع، تنفذ المعادلة y = x + sin(a*x)² * inv_b بكفاءة عالية
- نظام اكتشاف تلقائي ذكي: تطبيق `ggml_vk_can_fuse_snake` الذي يتعرف على تسلسل العمليات الخمس (mul, sin, sqr, mul, add) المُرسلة من BigVGAN وVocos ويعيد كتابتها تلقائياً
- شروط أمان صارمة للدمج: المطالبة بأن تكون tensors x وdst متصلة (contiguous) واستخدام فهرسة idx = i0 + i1 * ne0، مع ضرورة كون المعاملات a وinv_b من نوع GGML_TYPE_F32
- إعادة هيكلة نظام الربط: تطبيق اصطلاح ne0/ne1 المعياري عبر Vulkan backend وتوضيح دور كل buffer: data_a للتفعيل، data_b وdata_c للضرب المتجه، data_d للمخرجات
- حماية من حالات الاستثناء: رفض الدمج عندما تكون ne[2] أو ne[3] أكبر من 1، مع إضافة GGML_ABORT عند الحالات غير المدعومة بدلاً من السقوط الصامت لـ F32
الابتكار الحقيقي يكمن في معالجة عقدة الأداء التي تواجه مطوري الصوت عالي الجودة. (وفقاً للإصدار الرسمي) نماذج مثل BigVGAN وVocos تستخدم تفعيل Snake بكثافة، حيث كانت كل استدعاء يتطلب خمس عمليات منفصلة تستهلك الذاكرة والزمن عبر القراءة والكتابة المتعددة للبيانات المؤقتة.
التحديث يوفر 22 إصداراً مُحسناً، يشمل macOS Apple Silicon (arm64 عادي ومع KleidiAI)، macOS Intel x64، iOS XCFramework، مجموعة Ubuntu شاملة (x64 CPU وarm64 وs390x وVulkan x64/arm64 وROCm 7.2 وOpenVINO 2026.0 وSYCL FP32/FP16)، Android arm64، وWindows بتكوينات متعددة (CPU x64/arm64 وCUDA 12.4/13.1 وVulkan وSYCL) مع إتاحة مكتبات CUDA منفصلة.
التطوير استغرق عدة دورات مراجعة مع خبراء jeffbolznv و0cc4m، حيث أصروا على فحوصات الأنواع الصارمة وإزالة التبعيات المخفية. النتيجة هي نواة محسنة تحافظ على دقة الحوسبة مع تحسين جذري في الأداء لتطبيقات الصوت الاحترافية.







