
بقلم: ليلى | محررة أدوات المطورين · صوت تحريري بإشراف بشري
طرح فريق Comfy-Org الإصدار v0.21.0 من ComfyUI مع أكبر مجموعة تحديثات في تاريخ المنصة، تضم 90 تحسيناً عبر 60+ مساهمة من المطورين. التحديث يعيد هيكلة معالجة الوسائط بالكامل ويضيف دعماً شاملاً للنماذج الحديثة.
المحرك الجديد PyAV يحل محل Pillow في تحميل الصور، مما يخفض استهلاك الذاكرة بشكل جذري عند التعامل مع ملفات JPEG متعددة التنسيقات. نتيجة هذا التغيير؟ سير عمل أسرع وإمكانية معالجة ملفات أكبر على نفس الجهاز.
- قراءة متزامنة للصوت والفيديو – عقدة video loader تقرأ البيانات السمعية والمرئية معاً بدلاً من المعالجة المنفصلة، مما يحل مشاكل عدم التزامن في مشاريع الوسائط المتعددة
- استبدال PyAV بدلاً من Pillow – تحسين جذري في إدارة الذاكرة وسرعة التحميل، مع دعم أفضل لـ PNG مع شفافية tRNS وتنسيقات JPEG المتنوعة
- دعم شامل لـ Cogvideox – نموذج توليد الفيديو الجديد مع تحسين استهلاك VRAM وتسريع فك التشفير لفيديوهات عالية الجودة
- معاينة عالية الجودة لـ Flux2 – عرض أفضل للنواتج المخفية (latents) من نموذج Flux2 مع تفاصيل أوضح أثناء المعالجة
- حفظ النماذج ثلاثية الأبعاد – عقدة جديدة لحفظ ملفات 3D مع بادئة “3d/ComfyUI” للتنظيم التلقائي
- DynamicVRAM محسّن – خيار “–cache-ram 2” الجديد يدير ذاكرة GPU بذكاء أكبر مع تقليل الرسائل التحذيرية المزعجة
- دعم BiRefNet – نموذج إزالة الخلفيات المتطور للمعالجة الاحترافية للصور
- Gemma4 لتوليد النصوص – دعم كامل لنموذج Gemma4 في مهام الكتابة والحوار
- تحسين Auto-regressive video – توليد فيديو متقدم مع إمكانية التحكم في السياق والإطارات المرجعية
التحديث يتضمن إصلاحات تقنية حاسمة: معالجة meta-tensors غير المهيأة في CPU، حل تضارب الأجهزة في SolidMask وMaskComposite مع “–gpu-only”، وتحسين معايرة الذاكرة في interpolation الإطارات. كما أُضيف نظام feature flags عام مع “–list-feature-flags” للمطورين الذين يريدون تجربة الخصائص التجريبية.
شبكة Partner Nodes توسعت بنماذج جديدة: Luma UNI-1، Topaz Astra 2، وGrok-imagine مع زيادة المهلة الزمنية الافتراضية لاستدعاءات API. فريق ComfyUI وثّق أيضاً أن دورة الإصدارات المستقرة ستكون كل أسبوعين تقريباً، مما يضمن تدفقاً منتظماً للتحديثات دون المساس بالاستقرار.
هذا الإصدار يضع ComfyUI كمنصة رائدة في معالجة الذكاء الاصطناعي المرئي، خاصة مع تحول الصناعة نحو المحتوى متعدد الوسائط. التحسينات في استهلاك الذاكرة وحدها تجعل المشاريع المعقدة متاحة لفرق أكبر من المطورين.







