تُحدَّث يومياً

مصدرُك العربي
لمستقبل الذكاء الاصطناعي

أخبار، تقارير، أدوات وتحليلات يومية — كل ما تحتاجه لمتابعة ثورة الذكاء الاصطناعي باللغة العربية

✅ تم الاشتراك!
تعلم و استخدام الذكاء الاصطناعي

باحثون يطورون EvoArena لكشف عجز الوكلاء الذكية في التكيف مع البيئات المتطورة

🎧 استمع للملخص

بقلم: نور | محررة الأبحاث والدراسات · صوت تحريري بإشراف بشري

الوكلاء المدعومة بنماذج اللغة الكبيرة تتفوق في المعايير التقليدية، لكنها تنهار عندما تواجه الواقع. طور فريق من 14 باحثاً بقيادة Jundong Xu من جامعات متعددة منصة EvoArena لقياس أداء هذه الوكلاء في بيئات متغيرة، والنتائج صادمة: متوسط دقة 39.6% فقط عبر مجالات الأوامر الطرفية والبرمجيات والتفضيلات الاجتماعية (وفقاً لـ ArXiv).

المشكلة الأساسية أن معظم التقييمات تفترض بيئات ثابتة، بينما النشر الفعلي يتطلب تكيفاً مستمراً مع التغيرات. EvoArena تحاكي هذا الواقع من خلال نمذجة تغيرات البيئة كتسلسل من التحديثات التدريجية عبر ثلاثة مجالات رئيسية: بيئات الأوامر الطرفية حيث تتغير الأوامر والمجلدات، بيئات البرمجيات مع تحديثات الواجهات والميزات، والبيئات الاجتماعية التي تتطور فيها التفضيلات والقواعد.

الباحثون لم يكتفوا بتشخيص المشكلة، بل طوروا حلاً يُسمى EvoMem – نظام ذاكرة مبني على نموذج الترقيعات (patch-based) يسجل تطور الذاكرة كتواريخ تحديثات منظمة. هذا النهج يمكّن الوكلاء من التفكير في التطور البيئي من خلال فهم كيفية تغير ذاكرتها عبر الزمن، بدلاً من الاعتماد على لقطات ثابتة للحالة الحالية فقط.

النتائج التجريبية تؤكد قوة هذا النهج. EvoMem حسّن الأداء بشكل ثابت عبر معايير متعددة: زيادة متوسطة 1.5% على EvoArena، و6.1% على معيار GAIA، و4.8% على معيار LoCoMo (وفقاً لـ ArXiv). الأهم أنه حقق تحسناً بنسبة 3.7% في دقة السلاسل المترابطة على EvoArena، حيث يتطلب النجاح إكمال تسلسل متتالي من المهام الفرعية التطورية المترابطة.

التحليل الآلي يكشف السر وراء هذا التحسن: EvoMem يعزز التقاط الأدلة في الذاكرة، مما يحافظ على حالات البيئة المتطورة بشكل أكثر اكتمالاً. بدلاً من فقدان السياق التاريخي للتغيرات، يحتفظ النظام بخريطة شاملة لكيفية تطور البيئة، مما يمكّن الوكلاء من اتخاذ قرارات أكثر دقة.

هذا البحث يطرح تساؤلات مهمة حول الطريقة التي نصمم بها أنظمة الذكاء الاصطناعي للتطبيقات العملية. في السوق العربية، حيث تتغير متطلبات الأعمال بسرعة وتتطور التفضيلات الثقافية، الحاجة لوكلاء قادرة على التكيف تصبح أكثر إلحاحاً. التطبيقات المصرفية التي تحتاج للتكيف مع لوائح جديدة، منصات التجارة الإلكترونية التي تواجه تغيرات في سلوك المستهلكين، وأنظمة خدمة العملاء التي تتعامل مع قواعد متطورة – جميعها تستفيد من نهج الذاكرة التطورية.

التطبيق العملي لهذا البحث يتطلب إعادة تفكير في بنية أنظمة الذاكرة. بدلاً من الاعتماد على قواعد بيانات ثابتة أو تحديثات بسيطة، المطلوب أنظمة تفهم التطور كعملية مستمرة وتحافظ على السياق التاريخي. هذا قد يعني تصميم قواعد بيانات جديدة، تطوير خوارزميات استرجاع متقدمة، وإنشاء واجهات برمجة تطبيقات تدعم الذاكرة التطورية.

المثير أن النتائج تشير إلى أن المشكلة ليست في قوة النماذج ذاتها، بل في طريقة تعاملها مع التغير. هذا يفتح المجال أمام تحسينات كبيرة في الأنظمة الحالية دون الحاجة لنماذج أكبر أو أكثر تعقيداً، بل من خلال ذاكرة أذكى وأكثر تكيفاً مع طبيعة العالم الحقيقي المتغيرة باستمرار.

ArXiv

مقالات ذات صلة

زر الذهاب إلى الأعلى