تُحدَّث يومياً

مصدرُك العربي
لمستقبل الذكاء الاصطناعي

أخبار، تقارير، أدوات وتحليلات يومية — كل ما تحتاجه لمتابعة ثورة الذكاء الاصطناعي باللغة العربية

✅ تم الاشتراك!
تعلم و استخدام الذكاء الاصطناعي

ALTK-Evolve: كيف تحول وكيلك الذكي من ناسي المهام إلى خبير متراكم

تخيل طباخاً موهوباً يحفظ كل كتاب طبخ لكنه ينسى مطبخك كل صباح. لا يتذكر أن فرنك يسخن أكثر من المعتاد، أو أن الزبائن المعتادين يحبون الملح الإضافي، وسيتبع بطاقة الوصفة ثم يتجمد عندما ينفد الليمون. هكذا تعمل معظم الوكلاء الذكيين اليوم: ممتازون في اتباع التوجيهات، ضعفاء في تراكم الحكمة حول بيئتك.

هذا بالضبط ما يسميه باحثو IBM Research مشكلة “المتدرب الأبدي” – حيث تشير دراسة MIT الأخيرة إلى فشل 95% من مشاريع الذكاء الاصطناعي التجريبية لأن الوكلاء لا يتكيفون أو يتعلمون من العمل الفعلي.

حلهم الجديد ALTK-Evolve يغير قواعد اللعبة كلياً. بدلاً من إطعام سجلات الأمس للوكيل مرة أخرى – مما يجعله يعيد قراءة التاريخ دون تعميم منه – يحول النظام آثار التفاعل الخام إلى مبادئ توجيهية قابلة للإعادة الاستخدام.

الفكرة بسيطة لكنها ثورية: الوكلاء يحتاجون مبادئ، ليس نصوص حرفية. المتدرب يحتاج وصفات مختلفة لـ”الصوص الأبيض” و”بط البرتقال”، لكن الشيف يتعلم أن “الحمضية توازن الدهون” ويطبقها في كل مكان.

كيف يعمل النظام بالضبط

يدير ALTK-Evolve دورة تعلم مستمرة عبر تدفقين متوازيين. في التدفق النازل، يرصد النظام مسارات الوكيل الكاملة – أقوال المستخدمين، أفكار الوكيل، استدعاءات الأدوات، النتائج – عبر طبقة التفاعل مثل Langfuse أو أي أداة مراقبة تعتمد OpenTelemetry، ثم تستخرج أدوات قابلة للتبديل الأنماط الهيكلية وتحفظها كمرشحات كيانات.

في التدفق الصاعد، تدمج مهمة خلفية المكررات، تقلم القواعد الضعيفة، وتعزز الاستراتيجيات المثبتة، مطورة مكتبة عالية الجودة من المبادئ التوجيهية والسياسات وإجراءات التشغيل الموحدة. أخيراً، يسترجع النظام العناصر ذات الصلة فقط ويحقنها في السياق بالوقت المناسب.

هذا المنهج يعمل لأسباب محددة: يعلم الحكم عبر تحويل الأحداث لمرة واحدة إلى استراتيجيات قابلة للنقل بين المهام، يتحكم في التشويش بالحفاظ على ذاكرة نحيفة ومفيدة وليس درج قمامة متنامي، ويستخدم الكشف التدريجي بالاسترجاع في الوقت المناسب بدلاً من حشو كل شيء في السياق.

مخطط معمارية ALTK-Evolve يُظهر التدفق من رصد التفاعلات إلى استخراج المبادئ التوجيهية
معمارية ALTK-Evolve: من التفاعلات الخام إلى مبادئ قابلة للتطبيق

نتائج الاختبارات: تحسينات مثيرة في المهام الصعبة

اختبر الباحثون الإطار على معيار AppWorld حيث يكمل الوكلاء مهام واقعية متعددة الخطوات عبر واجهات برمجة التطبيقات، بمتوسط 9.5 واجهات عبر 1.8 تطبيقات، مع حالات صعبة تتطلب تدفق تحكم أكثر تعقيداً. حصل وكيل ReAct على تعليمات المهمة بالإضافة إلى أفضل 5 مبادئ توجيهية مسترجعة من تشغيل سابق واختُبر على قسم غير مرئي.

النتائج كانت واضحة، خاصة كلما صعبت المهام:

| الصعوبة | الأساس SGC | مع الذاكرة | التحسن |
|———|———–|————|——–|
| سهل | 79.0% | 84.2% | +5.2% |
| متوسط | 56.2% | 62.5% | +6.3% |
| صعب | 19.1% | 33.3% | +14.2% |
| الإجمالي | 50.0% | 58.9% | +8.9% |

الاستنتاجات الرئيسية من التقييمات واضحة: الوكيل يتحسن على مهام Test-Normal غير المرئية، دليل على أنه يتعلم مبادئ وليس يحفظ وصفات. التحسن يتناسب مع التعقيد – كلما صعبت المهمة، كلما استفاد الوكيل أكثر من المبادئ التوجيهية المركزة، مع أكبر رفع في المهام الأصعب حيث شهدت المهام الصعبة زيادة نسبية 74% في النجاح. أخيراً، مكاسب SGC تجاوزت تحسينات معدل النجاح الخام، مقللة السلوك “المتقلب” عبر متغيرات السيناريو.

طرق التنفيذ الثلاث

  1. بدون كود مع Claude Code (وضع Lite): ثبت المكون الإضافي في Claude Code عبر أمرين فقط: claude plugin marketplace add AgentToolkit/altk-evolve ثم claude plugin install evolve@evolve-marketplace. المكون يستخرج الكيانات من المسارات تلقائياً ويحفظها كملفات على نظام التشغيل مع استخدام خطافات Claude Code للاسترجاع التلقائي.
  2. كود قليل مع وكيل ReAct: أضف استيراد altk_evolve.auto واحد وفعل علامة لإرسال الآثار إلى واجهة Arize Phoenix. ثم زامن الآثار لتوليد مبادئ توجيهية للتحسين دون تغيير مكدسك الحالي، مع دعم عملاء LLM الشائعة وأطر الوكلاء مثل OpenAI وLiteLLM ووكلاء Hugging Face.
  3. كود احترافي مع CUGA: تكامل مباشر في CUGA عبر MCP لإنشاء حلقة تعلم محكمة قليلة الاستهلاك. قبل كل تشغيل، تُستدعى أداة get_guidelines MCP لاستخراج التوجيه الخاص بالمهمة وتقليل التجربة والخطأ، وبعد التشغيل، يرسل CUGA آثار التنفيذ المهيكلة عبر save_trajectory حتى يتعلم Evolve مما حدث فعلاً ويحسن التوجيه المستقبلي.
  4. تكاملات بخطوة واحدة: تتوفر أيضاً تكاملات مباشرة مع Codex وIBM Bob للاختبار السريع.

الوضع Lite سهل للاختبار لكنه محدود – لا يجمع أفكار من جلسات وكلاء متعددة أو ينفذ دمج وتنظيف الكيانات، بينما تعالج النسخ المتقدمة هذه القيود.

في منطقة الخليج ومصر، حيث تتسابق شركات مثل Tabby وTamara وCareem على اعتماد الوكلاء الذكيين، هذا الفرق بين وكيل يتعلم ووكيل يكرر يمكن أن يحدد النجاح التجاري. وكيل خدمة عملاء ينسى تفضيلات المستخدمين المحليين كل يوم لن يفيد، بينما وكيل يبني فهماً تراكمياً للسلوك والتفضيلات العربية سيتفوق حتماً.

لكن كن واقعياً حول القيود. النظام يتطلب بنية تحتية للمراقبة والتتبع، مما يعقد التنفيذ الأولي. كما أن الوضع Lite لا يتعامل مع التعلم عبر الجلسات أو إدارة الذاكرة المتقدمة. هذه ليست ترقية سحرية بل استثمار في بنية تعلم طويلة المدى.

مع ذلك، الاتجاه واضح والنتائج مقنعة: تحويل الوكلاء من متدربين أبديين إلى خبراء متطورين يبنون على تجاربهم. في سوق يطالب بوكلاء أكثر ذكاء واعتمادية، ALTK-Evolve قد يكون الخطوة التالية الحتمية لمن يريد وكلاء تتعلم بدلاً من أن تكرر.

المصدر

مقالات ذات صلة

زر الذهاب إلى الأعلى