
أعلنت شركة أنثروبيك عن إطلاق Claude Sonnet 4.6، أحدث تحديث لسلسلة نماذجها متوسطة الحجم، مع تحسينات ملحوظة في قدرات البرمجة، واتباع التعليمات، واستخدام الحاسوب، إضافة إلى دعم سياق موسع يصل إلى مليون رمز في النسخة التجريبية.
وأصبح Sonnet 4.6 النموذج الافتراضي للمستخدمين المجانيين والمشتركين المدفوعين، ما يعكس توجه الشركة لتعزيز الأداء القياسي عبر خطها الرئيسي من النماذج.
نافذة سياق أكبر بمرتين
تقدم النسخة التجريبية نافذة سياق بحجم مليون رمز، أي ضعف أكبر نافذة سياق كانت متاحة سابقًا لسلسلة Sonnet.
وبحسب أنثروبيك، يتيح هذا الحجم معالجة قواعد برمجية كاملة، أو عقود مطولة، أو عشرات الأوراق البحثية ضمن طلب واحد.
أداء قوي في الاختبارات
أظهرت نتائج القياس تحسنًا واسعًا عبر عدة معايير.
سجل النموذج 79.6% في اختبار SWE-Bench Verified لقياس مهارات البرمجة، بفارق طفيف عن نموذج Opus 4.6 الذي سجل 80.8%.
كما حقق 60.4% في اختبار ARC-AGI-2 المصمم لقياس مهارات قريبة من الذكاء البشري، و72.5% في معيار OSWorld لقياس قدرات استخدام الحاسوب وتنفيذ المهام الرقمية.
وأشارت الشركة إلى تحسن ملحوظ في اتباع التعليمات، مع قدرة Sonnet 4.6 على إنجاز مهام مكتبية كانت تتطلب سابقًا استخدام نموذج Opus الأعلى أداءً.
تحديثات متسارعة
يأتي إطلاق Sonnet 4.6 بعد أسبوعين فقط من طرح Opus 4.6، في إشارة إلى تسارع دورة تحديث النماذج لدى أنثروبيك. كما توقعت الشركة إصدار نسخة محدثة من نموذج Haiku خلال الأسابيع المقبلة.
يعكس هذا الإطلاق احتدام المنافسة في سوق النماذج اللغوية، حيث تتجه الشركات إلى توسيع قدرات السياق وتحسين الأداء في البرمجة والتفاعل مع الأنظمة، في مسعى لجعل النماذج أقرب إلى أدوات إنتاجية شاملة داخل بيئات العمل.
ويبقى السؤال: هل تصبح النماذج متوسطة الحجم قادرة على سد الفجوة مع النماذج الأكبر، ما يعيد رسم معادلة التكلفة مقابل الأداء في سوق الذكاء الاصطناعي؟
📌 الملخص:
أنثروبيك تطلق Claude Sonnet 4.6 مع تحسينات في البرمجة واستخدام الحاسوب، ونافذة سياق تصل إلى مليون رمز.
النموذج يصبح الافتراضي للمستخدمين، مع نتائج قوية تقترب من أداء Opus 4.6.







