نموذج Varya الهندي: فيديو ذكي أسرع عشر مرات وأرخص عشرين مرة

🎧 استمع للملخص

بقلم: ليلى | محررة أدوات المطورين · صوت تحريري بإشراف بشري

تطلق شركة Avataar AI الهندية، المدعومة من صندوق Peak XV، نموذج Varya لتوليد الفيديو بالذكاء الاصطناعي — وهو حل مصمم خصيصاً لفهم السياق المحلي الهندي وتقديم إنتاج فائق السرعة بتكلفة منخفضة جذرياً. يأتي هذا الإطلاق ضمن مبادرة الحكومة الهندية “India AI Mission” التي تستثمر 1.2 مليار دولار لدعم 12 شركة ناشئة مختارة في تطوير نماذج ذكاء اصطناعي محلية.

استخدمت Avataar تقنية التقطير (distillation) لبناء Varya، بدءاً من نموذج Wan 2.2 المفتوح المصدر من علي بابا وضغط قدراته في إصدار أسرع ومُحسَّن لاحتياجاتها الخاصة. النتيجة؟ نموذج ينتج الفيديو في 4 خطوات بدلاً من 50 خطوة في Wan 2.2، محققاً سرعة أعلى بعشر مرات وتكلفة أقل بشكل جذري.

الأرقام الملموسة تكشف الفارق الهائل: باستخدام وحدة معالجة NVIDIA H200، ينتج Varya مقطع فيديو بدقة 720p لمدة 5 ثوانٍ في 45 ثانية، مقارنة بـ 1,230 ثانية في Wan 2.2 (وفقاً لـ TechCrunch). أما التسعير، فهو الجانب الأكثر إثارة: 0.48 روبية هندية (0.005 دولار) لكل ثانية فيديو في خدمتها المستضافة — أي أرخص بـ 20 مرة من نماذج Veo وKling وLuma وRunway التي تتقاضى 0.10 دولار أو أكثر لكل ثانية.

لكن المشكلة الأساسية التي يحلها Varya ليست تقنية فحسب، بل ثقافية. تفتقر نماذج توليد الصور والفيديو الحالية إلى فهم الفروق الثقافية الدقيقة، وتنتج مخرجات نمطية أو عامة. استخدمت Avataar بيانات مُنسقة بعناية لتدريب Varya على التعرف على السياقات الثقافية المحلية — بما يشمل الطعام والملابس والعمارة والمهرجانات الهندية. هذا التخصص الثقافي ليس مجرد ميزة إضافية، بل ضرورة في بلد يعتمد على الفيديو كوسيلة تواصل أساسية عبر جميع منتجات الإنترنت الاستهلاكية الكبرى.

يعلق راجان أناندان، المدير الإداري لـ Peak XV: “الهند سوق يفضل الفيديو أولاً. نماذج الفيديو الحالية باهظة التكلفة للاستخدام على نطاق السكان في الهند. إذا كان الذكاء الاصطناعي للفيديو سيصل إلى الطلاب والمعلمين والمؤسسات الصغيرة والمتوسطة والمبدعين والمؤسسات والخدمات العامة، فيجب أن تنخفض التكاليف بشكل كبير. التكلفة هي أكبر مفتاح لاعتماد الذكاء الاصطناعي في الهند” (وفقاً لـ TechCrunch).

سيتم إطلاق Varya كنموذج مفتوح الأوزان على منصة India’s AI Kosh — المستودع المركزي للحكومة الهندية للنماذج ومجموعات البيانات المتاحة للعامة — مع بيانات التدريب الخاصة به، مما يعني أن المطورين يمكنهم استضافته بأنفسهم أو تعديله وفقاً لاحتياجاتهم. تخطط Avataar أيضاً لإتاحة النموذج لعملائها من المؤسسات وتقول إنها منفتحة على الشراكات مع أدوات الفيديو بما في ذلك Higgsfield و Adobe Firefly. يمكن لأي شخص تجربة النموذج الآن على موقعها الإلكتروني باستخدام مطالبات نصية أو صور مرجعية.

إطلاق Varya يعكس مفاضلة أساسية في طموحات الهند للذكاء الاصطناعي. لاحظ خبراء الصناعة أن الهند يمكنها أن تترك بصمتها في الذكاء الاصطناعي من خلال إنشاء التطبيقات وبناء نظام بيئي قوي للمطورين، بدلاً من التنافس على النماذج الأساسية. وهناك سبب لهذه البراغماتية: كان تطوير النماذج أبطأ في الهند منه في المنافسين العالميين بسبب نقص قوة الحوسبة ومحدودية توفر البيانات عالية الجودة.

مبادرة India AI Mission هي أيضاً جزء من دفعة حكومية أوسع لسد هذه الفجوة. العام الماضي، اختارت 12 شركة ناشئة — من بينها Avataar AI — لتطوير نماذج الذكاء الاصطناعي وزودتها بقوة حوسبية فعالة التكلفة. في وقت سابق من هذا العام، قال وزير تكنولوجيا المعلومات أشويني فايشناو إن الهند تهدف إلى جذب استثمارات بقيمة 200 مiliار دولار في الذكاء الاصطناعي بحلول 2028 ومضاعفة قدرة وحدات معالجة الرسوميات أكثر من الضعف خلال ستة أشهر (وفقاً لـ TechCrunch).

ما لم تقله الشركة بوضوح هو كيف ستتعامل مع التوسع العالمي — فبينما يُعتبر التخصص الثقافي نقطة قوة في السوق المحلي، قد يصبح عائقاً عند محاولة المنافسة مع نماذج عالمية أكثر تنوعاً ثقافياً في أسواق أخرى.

TechCrunch