
بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري
أطلق مشروع Llama.cpp إصداره B9603 مع إضافة مهمة: دعم معالجات Adreno GPU عبر OpenCL لتحسين أداء النماذج على هواتف أندرويد المزودة بمعالجات Qualcomm Snapdragon. التحديث طور نوى GEMM وGEMV جديدة لتنسيقات الكمية q5_0 وq5_1، بالتعاون مع مهندس Li He من كوالكوم نفسها.
هذا يعني أن تشغيل نماذج اللغة الكبيرة على هواتف سامسونج Galaxy وXiaomi وOnePlus وغيرها من الأجهزة المزودة بـ Snapdragon سيصبح أسرع وأكثر كفاءة في استهلاك البطارية. المطورون العرب العاملون على تطبيقات الذكاء الاصطناعي المحلية سيستفيدون بشكل خاص من هذا التطوير، خاصة في دول الخليج حيث تنتشر هذه الأجهزة بكثافة.
الإصدار يأتي مع 18 بناء مختلف يغطي جميع المنصات والتكوينات المطلوبة للتطوير:
- macOS: Apple Silicon (arm64) و Intel (x64) مع ملاحظة إيقاف KleidiAI مؤقتاً
- iOS: XCFramework للتطوير المباشر على التطبيقات المحمولة
- Linux Ubuntu: خمسة تكوينات تشمل CPU و Vulkan و ROCm 7.2 و OpenVINO مع دعم s390x
- Android: arm64 مع التحسينات الجديدة لمعالجات Adreno
- Windows: سبعة إصدارات تشمل CUDA 12 و CUDA 13 و Vulkan و HIP لبطاقات AMD
المفقود في هذا الإصدار: إيقاف مؤقت لدعم SYCL على Windows وLinux، وتعطيل كامل لنظام openEuler. السبب غير واضح من ملاحظات الإصدار، لكنه قد يشير إلى مراجعة تقنية أو مشاكل في سلسلة البناء الآلي.
للمطورين الراغبين في التجربة: إصدار Android الجديد متاح للتحميل مباشرة، بينما تحتاج إصدارات CUDA إلى تحميل ملفات DLL منفصلة. أما إصدار واجهة المستخدم فيأتي في ملف منفصل للذين يفضلون التفاعل البصري بدلاً من سطر الأوامر.







