
بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري
تحصل مكتبة llama.cpp الشهيرة على تحديث b8902 يجلب دعماً أصلياً لواجهة برمجة تطبيقات تحويل الصوت إلى النصوص لنماذج (LFM2-Audio وفقاً للإصدار الرسمي)، مما يفتح آفاقاً جديدة أمام المطورين الذين يبنون تطبيقات متعددة الوسائط.
التحديث لا يقتصر على الميزة الجديدة فحسب، بل يشمل 25 إصداراً مختلفاً يغطي كافة المنصات والمعمارات، من macOS بمعالجات Apple Silicon إلى أنظمة openEuler المتخصصة، مع تحسينات خاصة لمعالجات AMD وإنتل ووحدات معالجة الرسوميات المختلفة.
الإصدارات المتاحة للتحميل:
- macOS و iOS: إصداران لـ Apple Silicon (arm64 عادي ومحسن بـ KleidiAI)، إصدار macOS Intel (x64)، وحزمة iOS XCFramework للتطبيقات المحمولة
- Linux Ubuntu: سبعة إصدارات تشمل CPU فقط للمعمارات x64 و arm64 و s390x، إصدارات محسنة لـ Vulkan، ROCm 7.2 لمعالجات AMD، OpenVINO للاستدلال المحسن، وإصدارين SYCL بدقة FP32 و FP16
- Android: إصدار arm64 محسن للأجهزة المحمولة التي تعمل بمعالجات ARM
- Windows: سبعة إصدارات تدعم CPU فقط للمعمارات x64 و arm64، CUDA 12.4 و 13.1 مع مكتبات DLL منفصلة، Vulkan و SYCL و HIP لمعالجات AMD Radeon
- openEuler: أربعة إصدارات متخصصة تشمل x86 و aarch64 مع دعم معالجات 310p و 910b، وتحسين ACL Graph للأداء المتقدم
الجديد الأبرز هو دعم LFM2-Audio عبر API التحويل الصوتي، والذي يتيح للمطورين دمج قدرات معالجة الصوت مباشرة في تطبيقاتهم دون الحاجة لخدمات خارجية. هذا التطوير يضع llama.cpp في منافسة مباشرة مع خدمات الذكاء الاصطناعي السحابية، خاصة للمطورين الذين يفضلون التشغيل المحلي لأسباب تتعلق بالخصوصية أو التكلفة.
التنوع الكبير في الإصدارات يعكس نضج المشروع وفهم فريق التطوير لاحتياجات المطورين المختلفة. فبينما تركز إصدارات Windows على دعم CUDA للألعاب ومحطات العمل، تقدم إصدارات Linux خيارات متنوعة للخوادم والحوسبة عالية الأداء، في حين تستهدف إصدارات openEuler البيئات المؤسسية المتخصصة.
ما لم يوضحه الإعلان هو مستوى جودة تحويل الصوت مقارنة بحلول OpenAI Whisper أو خدمات Google، أو ما إذا كانت هناك قيود على طول الملفات الصوتية المدعومة أو اللغات المتاحة. هذه التفاصيل ستحدد مدى قابلية الاستخدام الفعلي في الإنتاج.





