
بقلم: نور | محررة الأبحاث والدراسات · صوت تحريري بإشراف بشري
عندما تصطدم نماذج اللغة بسقف قدراتها في المهام المعقدة، تبرز الحاجة لآليات تحسين جذرية تتجاوز الطرق التقليدية. فريق بحثي من هارفارد ومعهد ماساتشوستس للتكنولوجيا بقيادة Guowei Xu طور حلاً يدعى “البحث التطوري ثنائي الاتجاه” (Bidirectional Evolutionary Search – BES) يعيد تصور طريقة تحسن النماذج من نفسها.
المشكلة الجوهرية في الطرق الحالية مثل best-of-N sampling و tree search أنها تعتمد على إشارات تحقق متناثرة وتقيد الاستكشاف في مناطق الاحتمالية العالية للنموذج فقط. وفقاً للبحث المنشور على ArXiv، هذا يحبس المرشحات في “قشرة إنتروبية ضيقة” تمنع الوصول للحلول الإبداعية.
نهج BES يفكك هذا التحدي عبر آلية مزدوجة: البحث الأمامي الذي يدمج عمليات تطورية لإعادة تركيب المسارات الجزئية، والبحث العكسي الذي يفتت المهام الأصلية إلى أهداف فرعية قابلة للفحص. هذا التصميم ليس مجرد تحسين تقني، بل إعادة تفكير جذرية في كيفية تعلم الأنظمة الذكية.
- التطوير التركيبي للمرشحات: البحث الأمامي يستخدم عمليات تطورية تدمج أجزاء من مسارات مختلفة لتوليد حلول يستحيل الوصول إليها من تشغيل نموذج واحد، مما يحرر النظام من قيود الاحتمالية المحلية
- التفكيك التدريجي للمهام: البحث العكسي يحلل المهمة الأصلية ويقسمها تكرارياً إلى مهام فرعية أصغر وأوضح، منتجاً شبكة من نقاط التحقق التي توجه عملية البحث الأمامي
- التغذية الراجعة الكثيفة: النظام ينتج ردود فعل متوسطة مستمرة بدلاً من الاعتماد على التقييم النهائي فقط، مما يسرع التعلم ويحسن دقة التوجه نحو الحلول المطلوبة
- الهروب من القيود الاحتمالية: العمليات التطورية تمكن النظام من استكشاف مناطق خارج “القشرة الإنتروبية الضيقة” التي تحبس طرق البحث التقليدية، فاتحة آفاق حلول غير تقليدية
- التقليل الأسي للعينات المطلوبة: البحث العكسي يخفض عدد المحاولات المطلوبة للوصول للإجابة الصحيحة بشكل أسي مقارنة بالطرق التقليدية، وفقاً للتحليل النظري المقدم
- التدريب اللاحق للمهام الصعبة: أثبت النظام فعاليته في المهام التي فشلت خوارزميات التدريب السائدة في تحسينها، محققاً مكاسب ثابتة حيث توقفت الطرق الأخرى
- التفوق في حل المشاكل المفتوحة: على ثلاثة معايير لحل المشاكل المفتوحة وقت الاستنتاج، تفوق BES على جميع الأطر مفتوحة المصدر الموجودة في الأداء المتوسط وأفضل الحالات
التحدي الوحيد هو التكلفة الحاسوبية المرتفعة مقارنة بالطرق البسيطة، والحاجة لنماذج أساسية قادرة على التفكيك المنطقي للمهام. لكن الفريق البحثي لم يكتف بالنظرية – فقد أتاح الكود والنماذج المدربة مفتوحة المصدر للمجتمع البحثي.
هذا البحث يمثل نقلة من التحسين التدريجي إلى إعادة تصميم آليات التعلم الذاتي. وقت أن تصطدم نماذج اللغة بحدود قدراتها في المهام المعقدة، يقدم BES خارطة طريق للتجاوز، ليس فقط في الأداء، بل في طبيعة التفكير الآلي نفسه.







