مشكلة goblin في GPT-5.1: زيادة 175% غير مقصودة

🎧 استمع للملخص

بقلم: سارة | محررة نماذج الذكاء الاصطناعي · صوت تحريري بإشراف بشري

موظفو OpenAI لاحظوا شيئاً غريباً: كلمة “goblin” تظهر في مخرجات Codex كأنها ملاحظة لاصقة عالقة على الشاشة. التحقيق كشف أن GPT-5.1 بدأ يستخدم الكلمة بنسبة 175% أكثر بعد الإطلاق، مع ارتفاع “gremlin” بنسبة 52% (وفقاً لـ OpenAI).

الجاني كان شخصية “Nerdy” القديمة – نمط محادثة مصمم ليكون مرحاً وودوداً. رغم أنها شكّلت 2.5% فقط من إجابات ChatGPT، إلا أنها كانت مسؤولة عن 66.7% من استخدامات كلمة “goblin” في النظام (وفقاً لـ OpenAI). المشكلة الحقيقية ليست الكلمة نفسها، بل كيف تسرّبت عادة لغوية من سياق محدود إلى باقي النموذج.

إشارة المكافأة المصممة لجعل وضع Nerdy أكثر مرحاً علّمت النموذج تفضيلاً دائماً لمفردات معينة. هذا السلوك المكتسب امتد خارج الوضع المقصود وانتشر في جلسات التدريب اللاحقة، مما يثير سؤالاً مقلقاً: كم من العادات اللغوية غير المرغوبة يتعلمها النموذج دون أن نكتشفها؟

OpenAI تعاملت مع المشكلة بشكل مباشر: ألغت شخصية Nerdy، أزالت إشارة المكافأة المسببة للخلل، وأضافت فلاتر لكلمات المخلوقات الأسطورية في بيانات التدريب. لكن الدرس الأهم هو أن التفاصيل الصغيرة في تصميم المكافآت يمكن أن تخلق تأثيرات دائمة وغير متوقعة في سلوك النماذج اللغوية.

OpenAI تكشف كيف خلقت كلمة goblin مشكلة سلوكية في GPT-5.1

مقالات ذات صلة

مصدرُك العربيلمستقبل الذكاء الاصطناعي

مقالات ذات صلة

a16z تبحث عن مهندسي التصميم لبرنامج زمالة مدته 8 أسابيع

إيرادات جوجل تكشف معادلة معقدة بين اشتراكات YouTube ونمو Gemini

مقالات ذات صلة

Conway: كيف تخطط Anthropic لتحويل ذاكرة الوكلاء إلى قيود دائمة

شراكة بـ 2.75 مليار دولار تؤكد — الذكاء الاصطناعي يقود اكتشاف الأدوية اليوم

جوجل تطلق Gemini 3.1 Pro بقدرات استدلال متقدمة

نفيديا تطلق تقنية OpenShell لتأمين أنظمة الذكاء الاصطناعي المستقلة

مصدرُك العربي
لمستقبل الذكاء الاصطناعي