
بقلم: سارة | محررة نماذج الذكاء الاصطناعي · صوت تحريري بإشراف بشري
في اليوم التاسع عشر من تعليق الوصول، رفعت الحكومة الأمريكية ضوابط التصدير عن نموذجَي Claude Fable 5 وClaude Mythos 5، فأعادت أنثروبيك تفعيلهما ابتداءً من الأول من يوليو 2026. لكن القصة الحقيقية ليست في العودة — بل في ما كشفته هذه الأسابيع الثلاثة عن هشاشة العلاقة بين شركات الذكاء الاصطناعي والحكومات في لحظة أزمة.
الوقائع متسلسلة بدقة: أطلقت أنثروبيك النموذجين في التاسع من يونيو 2026. بعد ثلاثة أيام فقط، وفي الثاني عشر منه، صدر توجيه حكومي بتطبيق ضوابط التصدير فورياً، بعد أن رصد باحثون في أمازون طريقةً لتجاوز حواجز Fable 5 — تحديداً استدراجه لتحديد ثغرات برمجية وإنتاج كود يُظهر كيفية استغلال إحداها. لم تملك أنثروبيك أي آلية موثوقة للتحقق من جنسية المستخدمين في الوقت الفعلي، فعلّقت الوصول لجميع المستخدمين حول العالم دون استثناء.
ما جاء بعد ذلك أكثر إثارة للتساؤل من القرار نفسه. أجرت أنثروبيك اختبارات مقارنة على نماذج متعددة، فوجدت أن نماذج أقل قدرةً — من بينها Claude Opus 4.8، وGPT-5.5، وKimi K2.7 — يمكنها تحديد الثغرات ذاتها التي رُصدت في Fable 5. وحين تعلّق الأمر بالكود التوضيحي للثغرة الواحدة، فإن كل نموذج اختبرته الشركة أنتج النتيجة ذاتها: Claude Haiku 4.5، وSonnet 4.6، وOpus 4.6، وOpus 4.7، وOpus 4.8، وGPT-5.4، وGPT-5.5، وKimi K2.7. بمعنى آخر، التقنية المُبلَّغ عنها لم تكشف قدرات حصرية تميّز Fable 5 — فضلاً عن أنها لم تقترب من قدرات Mythos 5 الهجومية الأعمق.
هذا الاكتشاف يضع السؤال الجوهري على الطاولة: متى تستوجب ثغرة في نموذج ذكاء اصطناعي تدخلاً حكومياً؟ لا يوجد اليوم إجماع في الصناعة على إجابة. لا معيار مشترك لتصنيف خطورة “الاختراق” (Jailbreak)، ولا مرجعية يمكن للشركات والحكومات الاستناد إليها حين تنشأ أزمة مماثلة.
وصفت أنثروبيك في تقريرها المفصّل آلية الحواجز التي تعتمدها، وهي تعمل بمنطق “الدفاع بالعمق”: تدريب النموذج على رفض الطلبات الخطرة، ومصنّفات (Classifiers) تُراقب المحادثات في الوقت الفعلي وتحجب الإخراج المشبوه، إضافةً إلى تحليل أنماط الإساءة بأثر رجعي. غير أن الحواجز لا تعمل على خط ثنائي صارم بين “مسموح” و”محجوب” — بل تعمل بهامش أمان متعمّد يحجب طلبات يُرجَّح أنها بريئة، تحسباً لاحتمالية خطأ صغيرة.
لفهم ما جرى تحديداً، رسمت أنثروبيك نموذجاً تحليلياً لدرجات خطورة الاختراقات. الاختراق البسيط (Row C) يتيح الوصول إلى المنطقة الرمادية من هامش الأمان لكنه لا يصل إلى سلوكيات ضارة فعلية. الاختراق الضيق الضار (Row D) يفتح سلوكاً ضاراً محدداً. أما الاختراق الشامل (Row E) فيُفتح أمامه طيف واسع من السلوكيات الضارة — ولم يُكتشف أي منه لـ Fable 5 حتى الآن وفق تصريحات الشركة. التقنية المُبلَّغ عنها وقعت في فئة “الاختراق البسيط” بامتياز، أي أنها أتاحت مهام دفاعية روتينية لا تشكّل خطراً حقيقياً.
رغم ذلك، تحركت أنثروبيك بسرعة لتدريب مصنّف أمان محسَّن يستهدف السلوك المُبلَّغ عنه تحديداً، ويحجبه في أكثر من 99% من الحالات (وفقاً لأنثروبيك). الثمن كان قابلاً للتوقع: ارتفاع في حالات الإيجابيات الكاذبة خلال مهام البرمجة والتنقيح البرمجي الاعتيادية. ويُقرّ الباحثون في مركز CAISI التابع لوزارة التجارة الأمريكية بأن كلا الإصدارين — القديم والجديد من الحواجز — يمثلان قوة غير عادية في هذا المجال.
الجانب الأوسع من هذه الأزمة يتجاوز Fable 5 تحديداً. أسفر هذا الحادث عن إطلاق جهد مشترك بين أنثروبيك وأمازون ومايكروسوفت وجوجل وشركاء برنامج Glasswing الآخرين لبناء إطار صناعي موحّد لتقييم خطورة الاختراقات. الهدف هو توفير معيار موضوعي يُمكّن المطورين من تصنيف الاكتشافات وترتيب أولوياتها، ويُمكّن الحكومات من قراءة المستوى الحقيقي للخطر بدلاً من الاضطرار للتصرف في ظل الغموض.
على صعيد الوصول الحالي، عاد Fable 5 للمستخدمين العالميين على Claude.ai وClaude Code وClaude Cowork وClaude Platform. أصحاب خطط Pro وMax وTeam والمؤسسات المؤهَّلة يحصلون على Fable 5 ضمن 50% من حدود الاستخدام الأسبوعية حتى السابع من يوليو، ثم تنتقل إلى نظام الاعتمادات. أما على AWS وGoogle Cloud وMicrosoft Foundry فستعود بأسرع وقت ممكن. وفيما يخص Mythos 5، استُعيد وصوله في السادس والعشرين من يونيو لمجموعة محددة من المنظمات الأمريكية بموافقة حكومية، فيما تواصل أنثروبيك التنسيق لتوسيع الوصول لشركاء Glasswing المحليين والدوليين.
ما يستحق التأمل هو أن قرار تعليق الوصول جاء فورياً ودون تمييز، بينما عملية الرفع استغرقت ثمانية عشر يوماً من التفاوض والتنسيق. يعكس هذا التفاوت واقعاً راسخاً: الحكومات تتحرك في اتجاه التضييق بسرعة أكبر بكثير من سرعتها في التراجع عنه. وإذا كان الهدف بناء علاقة عمل صحية بين الصناعة والحكومات حول نماذج الذكاء الاصطناعي عالية القدرة، فإن الإطار المشترك المقترح ضرورة لا ترف — شريطة ألا يتحول إلى وثيقة دبلوماسية تُطمئن الجميع دون أن تُلزم أحداً.







