AutoMem وإدارة الذاكرة في نماذج اللغة الكبيرة

🎧 استمع للملخص

بقلم: نور | محررة الأبحاث والدراسات · صوت تحريري بإشراف بشري

نموذج مفتوح المصدر بحجم 32 مليار معامل يصل إلى مستوى أداء Claude Opus 4.5 وGemini 3.1 Pro Thinking — لا بتحسين قدراته على إنجاز المهام، بل بتعليمه كيف يتذكر. هذا ما حققه إطار AutoMem الذي قدّمه باحثون من جامعة ستانفورد بقيادة Shengguang Wu وزملاؤه في ورقة بحثية نُشرت في الأول من يوليو 2026 (وفقاً لـ arXiv).

الفكرة المحورية التي يقوم عليها AutoMem مستقاة من علم الإدراك البشري: الذاكرة ليست قدرة ثابتة، بل مهارة مكتسبة. الإنسان يتعلم تدريجياً ما يستحق الحفظ، ومتى يسترجع المعلومة، وكيف ينظّم معرفته — وهو ما يُعرف بالـ metamemory أو “ما وراء الذاكرة”. المشكلة أن نماذج اللغة الكبيرة الحالية تفتقر إلى هذه القدرة؛ فهي تُعطى ذاكرة خارجية لكنها لا تُدرَّب على استخدامها بكفاءة، تماماً كمن يُعطى مكتبة ضخمة دون أن يتعلم كيف يُنظّمها أو يبحث فيها.

يعمل AutoMem عبر حلقتين متوازيتين من التحسين. في الأولى، يراجع نموذج لغوي قوي المسارات الكاملة للعميل — آلاف الخطوات — ثم يعيد صياغة البنية التي تحكم كيفية تفاعل العميل مع ملفات الذاكرة: التعليمات الأولية، وهياكل الملفات، وقاموس الإجراءات المتاحة. في الثانية، تُرصد قرارات الذاكرة الجيدة من حلقات متعددة وتُستخدم كإشارة تدريب مباشرة لتحسين كفاءة النموذج في إدارة الذاكرة. المحور المشترك هو أن عمليات نظام الملفات — الإنشاء والحذف والتعديل — ترتقي إلى مستوى “أفعال ذاكرة أولى” بدلاً من كونها مجرد أدوات ثانوية (وفقاً لـ arXiv).

السبب الذي يجعل هذه المشكلة صعبة الحل يدوياً واضح من طبيعة المهام نفسها: المهام طويلة الأفق تمتد لآلاف الخطوات، وخطأ ذاكرة واحد قد يظل مخفياً طويلاً قبل أن تظهر تداعياته، مما يجعل المراجعة البشرية للمسارات الكاملة غير عملية تقريباً. هنا تكمن قيمة الأتمتة: النظام يفعل ما لا يستطيع الإنسان فعله بالسرعة والحجم المطلوبين.

اختبر الباحثون AutoMem على ثلاثة ألعاب إجرائية التوليد ومصمَّمة لاختبار التخطيط طويل الأمد: Crafter وMiniHack وNetHack. النتائج كانت لافتة: تحسين مهارة الذاكرة وحدها — دون أي تعديل على سلوك العميل في أداء المهام — رفع أداء العميل الأساسي بمعدل 2 إلى 4 أضعاف، وأوصل نموذجاً مفتوح المصدر بحجم 32 مليار معامل إلى مستوى تنافسي مع أنظمة الحدود الأمامية (وفقاً لـ arXiv).

ما يستوقف في هذه النتيجة ليس الرقم فحسب، بل دلالته: إذا كان تحسين الذاكرة وحده يضاعف الأداء أربع مرات، فنحن أمام متغير مُهمَل بشكل كبير في تصميم العملاء الذكيين الحاليين. معظم الجهود تنصبّ على تحسين قدرات الاستدلال أو توسيع نافذة السياق أو زيادة حجم النماذج — لكن AutoMem يقترح أن كيفية تنظيم النموذج لمعلوماته وقت الحاجة قد تكون رافعة أكثر فاعلية وأقل تكلفة. هذا يشبه الفارق بين معالج أسرع ونظام ملفات أفضل تنظيماً — أحياناً الثاني يصنع الفرق الأكبر في تجربة المستخدم الفعلية.

الورقة تضع AutoMem في سياق أشمل: إدارة الذاكرة مهارة مستقلة قابلة للتعلم، ومنفصلة عن مهارة أداء المهمة ذاتها. هذا التمييز قد يكون مدخلاً لتصميم جيل جديد من العملاء الذين لا يُدرَّبون فقط على ماذا يفعلون، بل أيضاً على كيفية تذكّر ما فعلوه، وما يحتاجون معرفته لاحقاً — وهو السؤال الجوهري في بناء أنظمة ذكاء اصطناعي حقيقية لمهام العالم الفعلي المستمرة والمعقدة. وللباحثين المهتمين بالتعمق في كيفية بناء عملاء ذكاء اصطناعي عملياً، يمكن الاطلاع على هذا الدليل التطبيقي حول بناء العملاء على AWS.

arXiv