تُحدَّث يومياً

مصدرُك العربي
لمستقبل الذكاء الاصطناعي

أخبار، تقارير، أدوات وتحليلات يومية — كل ما تحتاجه لمتابعة ثورة الذكاء الاصطناعي باللغة العربية

✅ تم الاشتراك!
أخبار الذكاء الاصطناعياختيار المحررين

نيفيديا تكسر الحواجز بين نماذج الذكاء الاصطناعي مع Cosmos 3

🎧 استمع للملخص

بقلم: سارة | محررة نماذج الذكاء الاصطناعي · صوت تحريري بإشراف بشري

بدلاً من التنقل بين عدة نماذج للحصول على قدرات مختلفة، تطرح نيفيديا حلاً موحداً مع Cosmos 3 – أول نموذج أساسي للعالم يجمع توليد الفيديو الفيزيائي والاستدلال والعمل في بنية واحدة. هذا النموذج متوفر اليوم على Hugging Face ويمثل تحولاً جذرياً عن الإصدارات السابقة التي تطلبت نماذج منفصلة لكل مهمة.

الثورة الحقيقية في Cosmos 3 تكمن في معماريته المبتكرة Mixture-of-Transformers (MoT) التي تعالج جميع أنماط البيانات – النص والصورة والفيديو والصوت والإجراءات – في فضاء تمثيل موحد. النموذج يقسم المدخلات إلى مسارين: مسار الانحدار التلقائي للاستدلال والفهم، ومسار الانتشار للتوليد الإبداعي.

روبوت يقوم بمهمة القطف والوضع في بيئة مولدة بواسطة Cosmos 3
نموذج Cosmos 3 ينتج محاكيات دقيقة لمهام الروبوتات المعقدة

نيفيديا تطلق إصدارين يلبيان احتياجات مختلفة: Cosmos 3 Nano بـ 8 مليارات معامل مصمم للعمل على محطات العمل بمعالجات RTX PRO 6000، بينما Cosmos 3 Super بـ 32 مليار معامل يستهدف البحوث وتوليد البيانات الاصطناعية واسعة النطاق على معالجات Hopper وBlackwell (وفقاً لمدونة Hugging Face).

القدرات الخمس الأساسية لـ Cosmos 3 تعيد تعريف الذكاء الاصطناعي الفيزيائي:

  1. توليد العوالم المرئية الواقعية: إنتاج فيديوهات تحترم قوانين الفيزياء من النصوص أو الصور أو مدخلات الإجراءات
  2. الاستدلال الفيزيائي المتطور: فهم عميق للحركة والسببية والعلاقات المكانية في البيئات الحقيقية
  3. التنبؤ التسلسلي: استشراف تطور المشاهد والإجراءات المستقبلية بناءً على الحالة الراهنة
  4. النمذجة الديناميكية ثنائية الاتجاه: العمل كنموذج ديناميكيات أمامي وعكسي للتطبيقات الروبوتية
  5. سياسات الروبوت المباشرة: توليد إجراءات تنفيذية للروبوتات من المدخلات البصرية والنصية فوراً
سيناريو قيادة نادر مولد بواسطة Cosmos 3 لتدريب المركبات ذاتية القيادة
إنتاج سيناريوهات قيادة نادرة لتعزيز تدريب الأنظمة ذاتية القيادة

التكامل مع مكتبة Hugging Face Diffusers يجعل استخدام النموذج مباشراً عبر Cosmos3OmniPipeline. المطورون يمكنهم البدء بكود بسيط لتوليد الصور من النصوص، بينما توفر الوثائق الشاملة على GitHub أمثلة متقدمة لتوليد الفيديو وتحويل الصورة إلى فيديو.

نيفيديا تصدر أيضاً ستة مجموعات بيانات اصطناعية متخصصة: مشاهد الروبوتات المجسدة، محاكيات فيزياء Isaac Sim، بيانات الاستدلال المكاني، الحركة الإنسانية الرقمية، سيناريوهات القيادة الذاتية، وعمليات أمان المستودعات. هذه المجموعات تدعم تطوير تطبيقات الذكاء الاصطناعي الفيزيائي المتنوعة.

مشهد مستودع مولد بالذكاء الاصطناعي لبيانات الأمان
محاكاة بيئات المستودعات لتطوير بروتوكولات الأمان المحسنة

التحدي الأساسي يكمن في المتطلبات الحاسوبية العالية لـ Cosmos 3 Super والحاجة المحتملة لتدريب إضافي على بيانات محددة للتطبيقات المتخصصة. ومع ذلك، توفر نيفيديا أدوات post-training شاملة لتخصيص النموذج وفقاً لاحتياجات المطورين الخاصة.

Hugging Face Blog

مقالات ذات صلة

زر الذهاب إلى الأعلى