ReContext: تحسين استدلال LLMs على السياقات الطويلة

🎧 استمع للملخص

بقلم: نور | محررة الأبحاث والدراسات · صوت تحريري بإشراف بشري

المشكلة ليست في طول السياق الذي تستطيع النماذج اللغوية استيعابه — بل في قدرتها على استخدام ما تستوعبه فعلاً. فرغم أن النماذج الحديثة تدعم نوافذ سياق تصل إلى 128,000 رمز، يكشف الباحثون أنها كثيراً ما تُخفق في توظيف الأدلة الصحيحة المدفونة داخل تلك المدخلات الطويلة. هذه الفجوة بين “الوصول إلى المعلومة” و”استخدامها فعلياً” هي ما يستهدفه بحث جديد نُشر على arXiv في الثاني من يوليو 2026.

الحل الذي يقدمه الفريق المؤلف من تسعة باحثين — من بينهم Yanjun Zhao وRuizhong Qiu وHanghang Tong — يحمل اسم ReContext، اختصاراً لـ “Recursive Evidence Replay as LLM Harness for Long-Context Reasoning”. الفكرة في جوهرها: بدلاً من اقتطاع السياق أو بناء ذاكرة خارجية، يُعيد النموذج تنظيم الأدلة الأكثر صلة بالسؤال ويُعيد تشغيلها قبل توليد الإجابة النهائية — مع الإبقاء على كامل السياق الأصلي دون حذف.

الآلية تعمل عبر ما يسميه الباحثون “الاختيار العودي”: يستخدم النموذج إشارات الانتباه الداخلية لديه — دون أي مكوّن خارجي — ليبني “مجمع أدلة مشروطاً بالاستعلام”، ثم يُعيد تشغيل هذه الأدلة قبل مرحلة التوليد. العملية تفصل بين مهمتين كانتا تجريان معاً في كل نموذج: تنظيم المعلومات من جهة، وتوليد الإجابة من جهة أخرى. وما يجعل هذا النهج مختلفاً عن المقاربات السابقة هو أنه لا يتطلب تدريباً، ولا ذاكرة خارجية، ولا حذف أي جزء من السياق الأصلي — مما يجعله قابلاً للتطبيق مباشرةً على النماذج الموجودة.

لفهم سبب نجاح هذه الطريقة نظرياً، يستند الباحثون إلى نموذج الذاكرة الترابطية: يُعامَل السياق الكامل كمستودع ذاكرة، والسؤال كإشارة استرجاع، وآلية الانتباه كرابط بين الإشارة والأثر، وإعادة التشغيل كتنشيط للأثر المختزن. الاستعارة مستعارة من علم الأعصاب الحسابي، وتمنح الإطار النظري متانةً تتجاوز الضبط التجريبي.

على صعيد النتائج، اختبر الفريق ReContext على ثمانية مجموعات بيانات مخصصة للاستدلال على سياقات طويلة، بطول سياق يبلغ 128K رمز (وفقاً للورقة البحثية). شملت التجارب ثلاثة نماذج مختلفة: Qwen3-4B وQwen3-8B وLlama3-8B. وفي الحالات الثلاث، حقق ReContext أفضل متوسط ترتيب على جميع النماذج الأساسية — وهي نتيجة تستحق الانتباه لأن النظام يعمل أثناء الاستدلال فقط، دون أي ضبط دقيق أو تعديل في أوزان النموذج.

ما يثير الاهتمام هنا ليس فقط الأداء، بل النهج المنهجي. معظم الحلول الحالية للسياقات الطويلة تلجأ إلى أحد مسارين: إما توسيع النافذة بمزيد من التدريب، وإما اقتطاع السياق وتصفيته قبل الإدخال. ReContext يرفض كلا المسارين ويقترح مساراً ثالثاً يُعيد توظيف قدرة النموذج الكامنة دون أن يُغيّر بنيته. هذا التوجه يجعله قريباً عملياً من نهج AutoMem الذي يُحسّن الأداء عبر إدارة الذاكرة وحدها، لا عبر توسيع المعمارية.

الكود متاح للعموم، ما يعني أن المطورين يستطيعون اختبار ReContext على نماذجهم المفضلة مباشرةً. غير أن الورقة لا تُفصح عن التكلفة الحسابية الإضافية لمرحلة إعادة التشغيل العودية — وهو السؤال الأكثر إلحاحاً لمن يفكر في نشر هذه التقنية في بيئة إنتاجية حيث زمن الاستجابة يُحسب بالمللي ثانية. ما نعرفه أن الطريقة تزيد من عدد مرات تشغيل آلية الانتباه، مما يعني تكلفة إضافية في كل طلب — قد تكون مقبولة في تطبيقات البحث والتحليل، لكنها قد تكون عائقاً في التطبيقات التي تتطلب استجابةً فورية.

arXiv