خلل خطير في حكام الذكاء الاصطناعي البصري يفضل النص

🎧 استمع للملخص

بقلم: نور | محررة الأبحاث والدراسات · صوت تحريري بإشراف بشري

عندما تطلب من نموذج ذكاء اصطناعي متعدد الوسائط تقييم إجابة عن صورة، قد تحصل على نتيجة خاطئة تماماً. ليس لأن النموذج لا يرى الصورة، بل لأنه يختار تصديق النص المكتوب حتى لو تناقض مع ما يراه بعينيه.

هذا ما اكتشفه فريق من ستة باحثين في جامعة كوريا الجنوبية، بقيادة سيوجونغ بارك، عندما حللوا سلوك النماذج اللغوية الكبيرة متعددة الوسائط في دور “الحاكم الآلي”. المشكلة أطلقوا عليها اسم “انحياز الحكم الإدراكي” – وهي أخطر مما تبدو.

الخلل يظهر بوضوح عندما تتعارض الأدلة البصرية مع النص المقترح كإجابة. تخيل صورة لتفاحة حمراء، والنموذج يقيم إجابتين: “التفاحة خضراء” مكتوبة بأسلوب مقنع علمياً، و”التفاحة حمراء” مكتوبة ببساطة. النماذج الحالية قد تعطي نقاطاً أعلى للإجابة الخاطئة بصرياً لمجرد أنها تبدو أكثر إقناعاً في النص.

الفريق البحثي لم يكتف بتشخيص المشكلة – بل بنى حلاً تقنياً متكاملاً. أولاً، أنشؤوا مجموعة بيانات خاصة تسمى “مجموعة بيانات الحكم المُضطرب إدراكياً” تحتوي على استجابات معدلة بدقة لعزل الأخطاء الإدراكية وجعل التحقق من صحة التقييم ممكناً.

ثم طوروا إطار تدريب موحد يجمع بين تقنيتين متقدمتين: مكافأة منظمة قائمة على GRPO، وهدف ترتيب الدفعات. هذا التصميم يمكن النموذج من تطوير ترتيب عالمي متماسك دون الحاجة لعلامات مقارنة زوجية صريحة – وهو تطور تقني مهم يوفر الوقت والموارد.

التجارب التي أجراها الفريق عبر مختلف معايير MLLM-as-a-Judge أظهرت تحسناً كبيراً في ثلاثة محاور رئيسية: الإخلاص الإدراكي (قدرة النموذج على الاعتماد على بصره الفعلي)، تماسك الترتيب (اتساق النتائج عبر حالات متشابهة)، والتوافق مع التقييم البشري.

النتائج تكشف عمق المشكلة في النماذج الحالية. عندما واجه الباحثون النماذج بـ “تلاعبات بصرية مُتحكم بها” – تغييرات طفيفة في الصور مع بقاء النص كما هو – وجدوا أن النماذج تتجاهل ما تراه وترتكن على النص بشكل أعمى.

هذا الاكتشاف له انعكاسات خطيرة على التطبيقات الحقيقية. في التعليم الطبي، قد يعطي نموذج نقاطاً عالية لطالب كتب تشخيصاً خاطئاً بأسلوب طبي مقنع، متجاهلاً الأعراض الواضحة في صورة الأشعة. في مراجعة المحتوى البصري، قد تُمرر مواد مضللة لمجرد أن وصفها النصي يبدو منطقياً.

الحل الذي طوره الفريق الكوري يمثل نقلة من مجرد “تحسين الرؤية” إلى “إعادة تدريب الحكم”. بدلاً من محاولة جعل النماذج ترى بشكل أفضل، يعيد تشكيل طريقة اتخاذها للقرارات عندما تتعارض مصادر المعلومات.

التقنية قابلة للتطوير والتطبيق على نماذج مختلفة، مما يجعلها حلاً عملياً لمشكلة واسعة الانتشار. لكن السؤال الأهم: لماذا لم تكتشف شركات التقنية الكبرى هذا الخلل من قبل؟ ربما لأن معظم الاختبارات تركز على الأداء العام بدلاً من السيناريوهات المتضاربة التي تكشف الانحيازات الحقيقية.

ArXiv