تُحدَّث يومياً

مصدرُك العربي
لمستقبل الذكاء الاصطناعي

أخبار، تقارير، أدوات وتحليلات يومية — كل ما تحتاجه لمتابعة ثورة الذكاء الاصطناعي باللغة العربية

✅ تم الاشتراك!
تعلم و استخدام الذكاء الاصطناعي

1000 حاسوب اصطناعي: منهجية جديدة لتدريب الوكلاء على مهام الإنتاجية المعقدة

🎧 استمع للملخص

بقلم: نور | محررة الأبحاث والدراسات · صوت تحريري بإشراف بشري

الآن يمكن لوكلاء الذكاء الاصطناعي التدرب في بيئات عمل شبه حقيقية تحتوي على مجلدات منظمة ومستندات وجداول بيانات وعروض تقديمية، بعد أن طور فريق بحثي من مايكروسوفت منهجية “Synthetic Computers at Scale” التي تنشئ حاسوبات اصطناعية واقعية لمحاكاة سيناريوهات الإنتاجية طويلة المدى.

المشكلة الأساسية التي تحلها هذه المنهجية هي أن العمل الإنتاجي الواقعي يعتمد بشكل كبير على بيئات الحاسوب المخصصة للمستخدم، حيث يتم تخزين وتنظيم سياق العمل عبر هياكل المجلدات والملفات الغنية بالمحتوى. (وفقاً للورقة البحثية) هذا السياق ضروري لإنجاز مهام تتطلب شهوراً من العمل البشري، لكن معظم أنظمة تدريب الوكلاء الحالية تفتقر إلى هذا الثراء البيئي.

  1. إنشاء الحاسوبات الاصطناعية: تطوير هياكل مجلدات واقعية مع محتوى غني من المستندات وجداول البيانات والعروض التقديمية التي تحاكي بيئات العمل الحقيقية للمستخدمين
  2. توليد أهداف إنتاجية مخصصة: وكيل متخصص ينشئ مهام إنتاجية محددة لكل حاسوب تتطلب عدة مخرجات مهنية وحوالي شهر من العمل البشري
  3. تشغيل محاكاة طويلة المدى: وكيل ثانٍ يعمل كمستخدم افتراضي ويستمر في العمل عبر الحاسوب لإكمال الأهداف المحددة
  4. التنقل في النظام: الوكيل يستكشف نظام الملفات للعثور على المعلومات المطلوبة والسياق اللازم لإنجاز المهام
  5. التنسيق مع المتعاونين المحاكيين: تفاعل الوكيل مع زملاء عمل افتراضيين لإكمال المشاريع التعاونية
  6. إنتاج المخرجات المهنية: إنشاء مستندات وعروض تقديمية وجداول بيانات وملفات عمل احترافية أخرى كمخرجات نهائية
  7. جمع إشارات التعلم: استخراج البيانات التدريبية الغنية من عملية المحاكاة بالكامل لتحسين أداء الوكلاء

في التجارب الأولية، أنشأ الباحثون 1,000 حاسوب اصطناعي وأجروا محاكاة طويلة المدى عليها. كل جلسة محاكاة تتطلب أكثر من 8 ساعات من وقت تشغيل الوكيل وتمتد عبر أكثر من 2,000 دورة تفاعل في المتوسط، مما ينتج كمية هائلة من البيانات التدريبية المعقدة.

النتائج الأولية تُظهر تحسناً كبيراً في أداء الوكلاء على تقييمات الإنتاجية، سواء في النطاق نفسه أو خارجه، مما يؤكد فعالية إشارات التعلم التجريبية الغنية التي تنتجها هذه المحاكاة المطولة.

القوة الحقيقية لهذه المنهجية تكمن في قابليتها للتوسع. نظراً لوفرة الشخصيات والأدوار المهنية على نطاق المليارات، يمكن نظرياً توسيع هذه المنهجية لتشمل ملايين أو حتى مليارات من عوالم المستخدمين الاصطناعية مع توفر الموارد الحاسوبية الكافية، مما يتيح تغطية أوسع للمهن والأدوار والسياقات والبيئات واحتياجات الإنتاجية المتنوعة.

الباحثون يؤكدون أن إنشاء الحاسوبات الاصطناعية القابل للتوسع، مع المحاكاة على نطاق واسع، يُعتبر أساساً واعداً للتحسين الذاتي للوكلاء والتعلم المعزز الوكيلي في سيناريوهات الإنتاجية طويلة المدى.

التحدي الأساسي حالياً هو التكلفة الحاسوبية الهائلة، حيث تتطلب كل محاكاة أكثر من 8 ساعات من الحوسبة المكثفة. بالإضافة إلى ذلك، ضمان واقعية البيئات الاصطناعية والمهام المُنشأة يتطلب تطويراً دقيقاً، وقياس جودة المخرجات الإنتاجية المعقدة يحتاج إلى مقاييس تقييم متطورة.

ArXiv

مقالات ذات صلة

زر الذهاب إلى الأعلى