Llama.cpp B9603 يدعم معالجات Adreno مع 18 إصداراً

🎧 استمع للملخص

بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري

أطلق مشروع Llama.cpp إصداره B9603 مع إضافة مهمة: دعم معالجات Adreno GPU عبر OpenCL لتحسين أداء النماذج على هواتف أندرويد المزودة بمعالجات Qualcomm Snapdragon. التحديث طور نوى GEMM وGEMV جديدة لتنسيقات الكمية q5_0 وq5_1، بالتعاون مع مهندس Li He من كوالكوم نفسها.

هذا يعني أن تشغيل نماذج اللغة الكبيرة على هواتف سامسونج Galaxy وXiaomi وOnePlus وغيرها من الأجهزة المزودة بـ Snapdragon سيصبح أسرع وأكثر كفاءة في استهلاك البطارية. المطورون العرب العاملون على تطبيقات الذكاء الاصطناعي المحلية سيستفيدون بشكل خاص من هذا التطوير، خاصة في دول الخليج حيث تنتشر هذه الأجهزة بكثافة.

الإصدار يأتي مع 18 بناء مختلف يغطي جميع المنصات والتكوينات المطلوبة للتطوير:

macOS: Apple Silicon (arm64) و Intel (x64) مع ملاحظة إيقاف KleidiAI مؤقتاً
iOS: XCFramework للتطوير المباشر على التطبيقات المحمولة
Linux Ubuntu: خمسة تكوينات تشمل CPU و Vulkan و ROCm 7.2 و OpenVINO مع دعم s390x
Android: arm64 مع التحسينات الجديدة لمعالجات Adreno
Windows: سبعة إصدارات تشمل CUDA 12 و CUDA 13 و Vulkan و HIP لبطاقات AMD

المفقود في هذا الإصدار: إيقاف مؤقت لدعم SYCL على Windows وLinux، وتعطيل كامل لنظام openEuler. السبب غير واضح من ملاحظات الإصدار، لكنه قد يشير إلى مراجعة تقنية أو مشاكل في سلسلة البناء الآلي.

للمطورين الراغبين في التجربة: إصدار Android الجديد متاح للتحميل مباشرة، بينما تحتاج إصدارات CUDA إلى تحميل ملفات DLL منفصلة. أما إصدار واجهة المستخدم فيأتي في ملف منفصل للذين يفضلون التفاعل البصري بدلاً من سطر الأوامر.

GitHub