
ملخص مختصر
كشفت مايكروسوفت عن نموذجين جديدين من تطوير فريق Microsoft AI (MAI): النموذج الصوتي MAI-Voice-1 لإنتاج كلام طبيعي ومعبر، والنموذج اللغوي MAI-1-preview كأول نموذج أساسي من إنتاج الشركة، مع بدء الاختبارات العامة في أغسطس 2025 عبر منصات مختلفة مثل Copilot وLMArena.
التفاصيل
- MAI-Voice-1: نموذج جيل كلام متطور يتميز بسرعة فائقة وقدرة على إنتاج دقيقة كاملة من الصوت في أقل من ثانية باستخدام وحدة معالجة رسومات واحدة (GPU).
- يتيح النموذج أداءً صوتيًا عالي الدقة والتعبير في سيناريوهات المتحدث الفردي والمتعدد، وهو متاح حاليًا في Copilot Daily والبودكاست، إضافة إلى تجربة تفاعلية جديدة في Copilot Labs.
- MAI-1-preview: نموذج أساسي (foundation model) يعتمد على بنية “mixture-of-experts” ودُرّب على نحو 15,000 وحدة معالجة رسومات من نوع NVIDIA H100.
- يُختبر النموذج حاليًا عبر منصة LMArena، مع خطط لدمجه تدريجيًا في بعض الاستخدامات النصية داخل Copilot.
- يُركز النموذج على تحسين أداء النماذج في مهام اتباع التعليمات وتقديم استجابات دقيقة وسريعة.
النتائج
- MAI-Voice-1 يُعتبر من أسرع أنظمة توليد الكلام المتاحة عالميًا، بفضل قدرته على إنتاج صوت عالي الجودة بزمن شبه فوري.
- MAI-1-preview يمثل أول محاولة مايكروسوفتية لتقديم نموذج أساسي داخلي بالكامل، ما يفتح الباب أمام تحسينات مستقبلية موجهة نحو المستخدمين النهائيين.
- النماذج ستعزز منتجات Copilot عبر ملايين التفاعلات اليومية، اعتمادًا على أفضل مزيج من النماذج الداخلية والمفتوحة المصدر.
لماذا يهم الأمر؟
يمثل إطلاق MAI-Voice-1 وMAI-1-preview خطوة استراتيجية مهمة لمايكروسوفت في سباق تطوير الذكاء الاصطناعي التوليدي. هذه النماذج تدعم رؤية الشركة في توفير مساعد ذكي متعدد الأوجه يجمع بين التفاعل الصوتي والنصي بشكل موثوق وسريع. على المستوى العربي، يمكن لهذه التطورات أن تفتح الباب لتطبيقات أوسع في مجالات التعليم، الإعلام، وخدمات العملاء باللغة العربية عند دمج مثل هذه النماذج مع تقنيات معالجة اللغة الطبيعية.
خلاصة من 3 أسطر
أعلنت مايكروسوفت عن إطلاق نموذجين جديدين: MAI-Voice-1 لإنتاج صوت طبيعي وMAI-1-preview كنموذج أساسي متطور. تكمن أهمية الخطوة في تعزيز قدرات Copilot وتوسيع إمكانيات التفاعل النصي والصوتي. يمكن أن ينعكس هذا التطور إيجابًا على العالم العربي عند دمج النماذج في تطبيقات التعليم والخدمات الرقمية.




