Claude Opus 4.8 مع وكلاء متوازيين وتقليل أخطاء بـ75%

🎧 استمع للملخص

بقلم: سارة | محررة نماذج الذكاء الاصطناعي · صوت تحريري بإشراف بشري

كشفت Anthropic النقاب عن Claude Opus 4.8 اليوم، وهو تحديث يُعيد تعريف قدرات الوكلاء الذكية من خلال تقنية التدفقات الديناميكية التي تُشغّل مئات الوكلاء بشكل متوازٍ، إلى جانب نظام تحكُّم جديد في مستوى الجهد المبذول وتحسينات جذرية في دقة كشف الأخطاء البرمجية.

الإنجازات الرقمية الجديدة لـ Opus 4.8:

84% على معيار Online-Mind2Web: أعلى نتيجة مُسجّلة للتفاعل مع المتصفحات، متفوقاً على Opus 4.7 وGPT-5.5 (وفقاً لـ Anthropic)
100% معدل إنجاز على Super-Agent benchmark: النموذج الوحيد الذي أكمل جميع الحالات من البداية للنهاية، متفوقاً على النماذج السابقة وGPT-5.5 بنفس التكلفة
أول نموذج يتجاوز 10% في Legal Agent Benchmark: أعلى نتيجة مُسجّلة في المعيار الشامل للعمل القانوني
61% توفير في تكلفة الرموز المميزة: مقارنة بـ Opus 4.7 عند معالجة ملفات PDF والمخططات والمحتوى غير المنظم
تخفيض نسبة الأخطاء البرمجية غير المكتشفة بـ 75%: أقل احتمالاً بأربع مرات للسماح بعيوب في الكود دون ملاحظتها مقارنة بالإصدار السابق

الميزة الثورية الجديدة تكمن في تدفقات العمل الديناميكية داخل Claude Code، حيث يُخطط النموذج للعمل ثم يُشغّل مئات الوكلاء الفرعية المتوازية في جلسة واحدة، ليتحقق من المخرجات قبل تقديمها للمستخدم. هذا يُمكّن Claude من تنفيذ ترحيلات على مستوى قواعد البيانات الضخمة عبر مئات الآلاف من أسطر الكود من البداية للدمج، باستخدام مجموعة الاختبارات الموجودة كمرجع للجودة.

شركات التقنية الرائدة شهدت تحسينات مُلموسة – في Databricks Genie، يحل Opus 4.8 استفسارات البيانات متعددة الخطوات بشكل أسرع من أي إصدار Opus سابق، بينما قوته متعددة الوسائط تُمكّنه من فهم ملفات PDF والمخططات والمحتوى غير المنظم مباشرة. في منصة Hebbia لمعالجة الوثائق المالية، يُحافظ النموذج على نفس جودة Opus 4.7 مع دقة أفضل في الاستشهادات وكفاءة أعلى في استخدام الرموز المميزة.

على صعيد الشفافية والموثوقية، يُمثّل Opus 4.8 قفزة نوعية في الصدق – أقل احتمالاً بأربع مرات للقفز إلى استنتاجات غير مدعومة أو ادّعاء التقدم في العمل رغم ضعف الأدلة (وفقاً لـ Anthropic). يُظهر تقييم المواءمة أن النموذج “يصل لأعلى المعدلات في سماتنا الاجتماعية الإيجابية مثل دعم استقلالية المستخدم والعمل لصالح المستخدم”، مع معدلات سلوك غير متوافق أقل بكثير من Opus 4.7.

ثلاث ميزات إضافية تُطلق اليوم: التحكم في مستوى الجهد عبر claude.ai يُتيح للمستخدمين اختيار مقدار التفكير الذي يبذله Claude – إعدادات أعلى تعني تفكيراً أعمق وأداء أفضل، بينما الإعدادات الأقل توفر سرعة أكبر واستهلاك أقل للحدود اليومية. الوضع السريع يعمل الآن بسرعة 2.5 ضعف مع تكلفة أقل بثلاث مرات من النماذج السابقة. Messages API المُحدّث يقبل إدخالات النظام داخل مصفوفة الرسائل، مما يُمكّن المطورين من تحديث تعليمات Claude أثناء المهمة دون كسر ذاكرة التخزين المؤقت.

التسعير يبقى ثابتاً عند 5 دولارات لكل مليون رمز مدخل و25 دولاراً لكل مليون رمز مخرج، بينما الوضع السريع متوفر بـ10 و50 دولاراً على التوالي. Anthropic رفعت حدود الاستخدام في Claude Code لاستيعاب الاستهلاك الأعلى للرموز المميزة في مستويات الجهد العليا.

الأفق القادم يحمل المزيد – تعمل الشركة على تطوير نماذج توفر قدرات Opus بتكلفة أقل، بالإضافة إلى فئة جديدة من النماذج عالية الذكاء. ضمن Project Glasswing، عدد محدود من المؤسسات تستخدم حالياً Claude Mythos Preview للأعمال الأمنية السيبرانية، لكن نماذج هذا المستوى تتطلب ضمانات أمنية أقوى قبل الإطلاق العام. Anthropic تتوقع إتاحة نماذج من مستوى Mythos لجميع العملاء خلال الأسابيع القادمة.

Anthropic