الأسئلة البلاغية في نماذج اللغة تتطلب 3 أنظمة تشفير

🎧 استمع للملخص

بقلم: نور | محررة الأبحاث والدراسات · صوت تحريري بإشراف بشري

تحقق النماذج اللغوية الكبيرة دقة 0.7-0.8 في التمييز بين الأسئلة البلاغية والاستفهامية، لكن الآلية الداخلية أبعد ما تكون عن البساطة. (وفقاً لدراسة ArXiv)

اختبر الباحثون لوي هونغ ياو وفيشيش آناند ويوان زوانغ وتيانيو جيانغ فرضية وجود “اتجاه واحد” لتمثيل الأسئلة البلاغية باستخدام تقنية Linear Probing على مجموعتين من بيانات وسائل التواصل الاجتماعي. النتيجة المفاجئة: المجسات المدربة على بيانات مختلفة تنتج ترتيبات مختلفة تماماً للأسئلة نفسها، رغم تحقيق نفس مستوى الدقة.

عندما طبق الفريق مجسين مدربين على مجموعتي بيانات منفصلتين على نفس العينات المستهدفة، كان التداخل في العينات الأعلى ترتيباً أقل من 0.2 في معظم الحالات. (وفقاً لدراسة ArXiv) هذا يعني أن كل مجس يصنف أسئلة مختلفة كأكثر بلاغية، رغم وصول كليهما لنفس الدقة النهائية.

الإشارات المبكرة والاستقرار المتأخر: تظهر المؤشرات البلاغية في الطبقات الأولى للنموذج، لكنها تصل لأقصى استقرار في تمثيلات الرمز الأخير
الفصل الخطي داخل السياق الواحد: ضمن نفس مجموعة البيانات، تحقق المجسات AUROC بين 0.7-0.8 في فصل الأسئلة البلاغية عن الاستفهامية
تناقض في النقل بين المجموعات: المجسات تحتفظ بقدرتها على التصنيف عند النقل، لكنها تركز على أسئلة مختلفة تماماً
نمط الخطاب مقابل التركيب النحوي: التحليل النوعي يكشف أن بعض المجسات تلتقط الموقف البلاغي في السياق الخطابي الممتد، بينما تركز أخرى على الأفعال الاستفهامية المحلية المبنية نحوياً
تعدد الاتجاهات الخطية: الأسئلة البلاغية تُشفر عبر اتجاهات خطية متعددة تؤكد على إشارات مختلفة، وليس اتجاهاً موحداً واحداً

الاكتشاف الأكثر إثارة يأتي من التحليل النوعي للتباينات. المجسات المدربة على بيانات حوارية طويلة تركز على الأسئلة البلاغية المدمجة في نقاشات ممتدة وحجج معقدة، بينما المجسات المدربة على منشورات قصيرة تركز على الأسئلة البلاغية ذات البنية النحوية المميزة أو الكلمات الاستفهامية المحددة.

هذا التنوع في التمثيل يطرح سؤالاً حول استراتيجية تحسين النماذج. بدلاً من البحث عن تمثيل عالمي للبلاغة، قد نحتاج لتطوير مجسات متخصصة لكل سياق خطابي. المطورون الذين يعملون على تطبيقات محادثة طويلة قد يحتاجون لمقاربة مختلفة عن أولئك الذين يركزون على التفاعل السريع أو التحليل النحوي.

البحث يثير أيضاً تساؤلات حول المفاهيم اللغوية الأخرى. إذا كانت الأسئلة البلاغية – وهي ظاهرة محددة نسبياً – تتطلب هذا التعقيد في التمثيل، فماذا عن السخرية أو التلميح أو المعاني الضمنية؟ ربما حان الوقت لإعادة تقييم افتراضات البساطة في التمثيل الداخلي للمعاني المعقدة.

ArXiv