LLM unlearning — LACUNA يكشف زيف حذف البيانات الحساسة

🎧 استمع للملخص

بقلم: نور | محررة الأبحاث والدراسات · صوت تحريري بإشراف بشري

الأساليب الحالية لـ”unlearning” في النماذج اللغوية الكبيرة تُقنعك بأن البيانات الحساسة اختفت، لكنها في الواقع مجرد مُخبّأة — وهذا ما يُثبته LACUNA، أول بيئة اختبار مزوّدة بحقيقة أرضية على مستوى المعاملات (ground-truth parameter-level localization). الورقة البحثية صدرت في 2 يوليو 2026 عن فريق من خمسة باحثين — Matteo Boglioni، Thibault Rousset، Siva Reddy، Marius Mosbach، وVerna Dankers — وتضع علامة استفهام كبيرة على كل ما نعتقد أننا نعرفه عن إزالة البيانات من النماذج.

المشكلة ليست نظرية. النماذج اللغوية تحفظ معلومات التعريف الشخصية (PII) التي تمر عليها أثناء التدريب، وحين يُطالب أصحابها بحذف بياناتهم — وهو حق مكفول قانونياً في كثير من الدول — تُدّعى عمليات unlearning تُغيّر سلوك النموذج في الخرج دون أن تمس الأوزان الحاملة للمعلومة أصلاً. النتيجة: هجمات resurfacing قادرة على إعادة استخراج البيانات “المحذوفة” بمجرد استجواب النموذج بطريقة مختلفة، وفق ما رصدته الورقة (arXiv).

ما يجعل LACUNA مختلفة جذرياً هو طريقة بنائها. بدلاً من قياس الخرج فقط كما تفعل كل المعايير المرجعية الموجودة، تُحقن بيانات PII لأفراد خياليين في معاملات محددة وموثّقة مسبقاً من نماذج OLMo بحجمَي 1 مليار و7 مليار معامل — وذلك عبر تقنية masked continual pretraining. هذا يمنح الباحثين قدرة غير مسبوقة: معرفة بالضبط أي الأوزان تحمل المعلومة، ثم التحقق لاحقاً مما إذا كانت عمليات unlearning قد استهدفت تلك الأوزان بالذات أم لا.

نتائج المعيار المرجعي الجديد جاءت صارمة. عند اختبار أحدث أساليب unlearning المتاحة (SOTA)، أثبتت الدراسة أن هذه الأساليب تُظهر أداءً قوياً على مستوى الخرج الظاهري، لكنها غير دقيقة للغاية في استهداف الأوزان الصحيحة، وتبقى عرضة لهجمات resurfacing التي تُعيد استخراج المعلومات الحساسة. بمعنى آخر: النموذج يتظاهر بأنه نسي، لكنه لم ينسَ فعلاً (arXiv).

في المقابل، كشف LACUNA عن بصيص أمل جوهري: حين يُصاب التوطين localization بدقة — أي حين يُحدَّد فعلاً الوزن الذي يختزن المعلومة — حتى أبسط أسلوب قائم على gradient يُحقق حذفاً قوياً ومقاومة عالية لهجمات الاستعادة. هذا يعني أن قيمة unlearning الحقيقية ليست في تعقيد خوارزمية النسيان، بل في دقة التوطين الذي يسبقها.

من زاوية تقنية، يتساءل الفريق عن سؤال ظل بلا إجابة منذ سنوات: هل unlearning يمحو المعرفة أم يُموّهها؟ المعايير الموجودة لا تستطيع الفصل بين الحالتين لأنها تقيس الخرج فقط. LACUNA تحل هذا بإتاحة التحقق المباشر من الأوزان، وهو نقلة منهجية لا نقلة تقنية وحسب.

للباحثين في خصوصية النماذج وللمطوّرين المعنيين بالامتثال لأنظمة حماية البيانات — كـ GDPR وما شابهه — يُقدّم LACUNA أداة قياس موضوعية للمرة الأولى: تستطيع أن تتحقق بنفسك مما إذا كانت عملية الحذف التي تطبّقها تُغيّر الأوزان المسؤولة عن تخزين المعلومة أم لا. البيئة متاحة للعموم وتُكمّل تقييمات السلوك الظاهري السائدة، بحيث يصبح تقييم unlearning ذا طابعَين: ماذا يقول النموذج؟ وماذا يختزن فعلاً؟

arXiv