تُحدَّث يومياً

مصدرُك العربي
لمستقبل الذكاء الاصطناعي

أخبار، تقارير، أدوات وتحليلات يومية — كل ما تحتاجه لمتابعة ثورة الذكاء الاصطناعي باللغة العربية

✅ تم الاشتراك!
تعلم و استخدام الذكاء الاصطناعي

MoRight يكسر حاجز الحركة المقيدة في إنتاج الفيديو بالذكاء الاصطناعي

يواجه مطورو تطبيقات الفيديو معضلة جوهرية: كيف تجعل الذكاء الاصطناعي ينتج فيديو لكرة تصطدم بصندوق فيتحرك، بينما أنت تحرك الكاميرا بحرية دون أن تفسد منطق التفاعل؟ MoRight، الإطار الجديد الذي طوره فريق من ثمانية باحثين بقيادة شاوي ليو ونُشر في أرشيف arXiv هذا الشهر، يكسر هذا القيد نهائياً.

المشكلة ليست تقنية فقط بل أساسية في فهم الحركة نفسها. النظم الحالية تخلط حركة الكاميرا بحركة الأجسام في “إشارة تتبع واحدة”، وتتعامل مع الحركة كمجرد إزاحة بكسلات على الشاشة بدلاً من فهم أن اصطدام كرة بصندوق يجب أن يحرك الصندوق فعلاً. النتيجة: فيديوهات تبدو كأنها مونتاج رقمي أكثر من كونها واقعاً فيزيائياً.

يعيد MoRight تعريف مشكلة إنتاج الفيديو بتقسيمها لمكونين منفصلين: التحكم المنفصل في الحركة والسببية الحركية. يحدد المستخدم حركة الأجسام في منظور ثابت قياسي، ثم ينقل النظام هذه الحركة إلى أي زاوية كاميرا مرغوبة عبر آلية “الانتباه الزمني عبر وجهات النظر” (temporal cross-view attention). أما السببية فتأتي من تقسيم الحركة إلى نشطة (يحددها المستخدم) وسلبية (نتائج وردود أفعال يتعلمها النظام).

  1. تحديد الحركة في المنظور القياسي: المستخدم يحدد الحركة الأساسية للجسم المحرك في إطار مرجعي ثابت، مثل “الكرة تندفع يساراً بسرعة X”
  2. فصل تحكم الكاميرا: النظام ينقل هذه الحركة إلى زاوية الكاميرا المختارة باستخدام خوارزمية الانتباه المتقدمة دون تشويه منطق الحركة
  3. حساب التفاعلات السلبية: MoRight يتنبأ تلقائياً بردود أفعال الأجسام الأخرى، مثل اهتزاز الصندوق أو سقوطه عند الاصطدام
  4. التحكم الديناميكي في زاوية الرؤية: المستخدم يمكنه تعديل مسار ومنظور الكاميرا في الوقت الفعلي دون التأثير على فيزياء التفاعل
  5. الاستدلال العكسي المتقدم: تحديد النتيجة المرغوبة (مثل سقوط الصندوق) والنظام يحسب تلقائياً القوة والاتجاه اللازمين لتحقيقها
  6. دمج السياق المكاني: النظام يراعي البيئة المحيطة والقيود الفيزيائية لضمان واقعية التفاعلات

اختبر الفريق MoRight على ثلاث مجموعات بيانات معيارية وحقق تفوقاً واضحاً في ثلاث مقاييس حاسمة: جودة الإنتاج (generation quality)، وقابلية التحكم في الحركة (motion controllability)، ووعي التفاعل (interaction awareness). هذه النتائج تعني أن النظام لا ينتج فيديوهات أجمل فقط، بل أكثر منطقية ودقة فيزيائية.

للمطورين والمؤسسين في المنطقة العربية، خاصة في السعودية والإمارات ومصر، يمثل MoRight نقلة في تطوير تطبيقات المحتوى التفاعلي والألعاب والتعليم الرقمي. تخيل تطبيق تعليم الفيزياء يمكن للطلاب فيه تحريك الأجسام ومشاهدة التفاعلات الحقيقية من أي زاوية، أو لعبة محمولة تنتج مشاهد حركة معقدة في الوقت الفعلي.

التحدي الأكبر أمام MoRight حالياً هو التدريب على بيانات ضخمة لتعلم العلاقات السببية المعقدة بين آلاف أنواع الأجسام والمواد المختلفة، وهو ما يتطلب قوة حاسوبية هائلة. لكن النهج المبتكر في معالجة الحركة كمفهوم منفصل عن العرض المرئي قد يعيد تشكيل صناعة إنتاج المحتوى المرئي بالكامل، خاصة للتطبيقات التي تحتاج دقة فيزيائية عالية مثل المحاكيات الطبية والهندسية.

المصدر

مقالات ذات صلة

زر الذهاب إلى الأعلى