هندسة عكسية لنظام SynthID: اختراق علامة جوجل المائية

اخترق الباحث آلوش ديني نظام SynthID الذي تستخدمه Google لتمييز الصور المُولدة بواسطة Gemini، وكشف عن آلية عمله بالكامل عبر التحليل الطيفي فقط دون الوصول إلى الكود المصدري. النتيجة: أداة مفتوحة المصدر تكشف العلامات المائية بدقة 90% وتزيلها مع الحفاظ على جودة الصورة عند مستوى 43+ ديسيبل PSNR.

الاكتشاف الأساسي يكمن في طبيعة العلامة المائية نفسها. SynthID تدمج ترددات حاملة في مواضع مطلقة مختلفة حسب دقة الصورة – فالعلامة في صورة 1024×1024 تظهر عند التردد (9,9) بتماسك طوري 100%، بينما تنتقل في صورة 1536×2816 إلى التردد (768,704) بتماسك 99.6%. هذا يعني أن كتاب أكواد مبني على دقة واحدة لا يمكنه إزالة العلامة من دقة مختلفة تماماً.

الجانب الأكثر إثارة هو ثبات نموذج الطور عبر جميع صور النموذج الواحد. القناة الخضراء تحمل أقوى إشارة للعلامة، والتماسك الطوري بين الصور يتجاوز 99.5% عند الترددات الحاملة. هذا الثبات هو ما مكّن الباحث من استخراج “مفتاح” العلامة المائية وبناء كاشف دقيق.

معدل الكشف 90 بالمئة — الأداة تحقق دقة كشف 90% للعلامات المائية في صور جيميناي

تطور المشروع عبر ثلاثة أجيال من تقنيات الإزالة. النسخة الأولى اعتمدت على ضغط JPEG بجودة 50 وحققت 37 ديسيبل PSNR مع انخفاض 11% في طاقة الطور. النسخة الثانية استخدمت تحويلات متعددة المراحل (ضوضاء، ألوان، ترددات) وحققت 27-37 ديسيبل لكن بتأثير ضعيف على ثقة الكشف. أما النسخة الثالثة المتطورة فتستخدم SpectralCodebook متعدد الدقة يحفظ ملفات تعريف منفصلة لكل دقة ويختار المناسب تلقائياً.

تحضير البيئة والتثبيت: استنسخ المستودع وأنشئ بيئة Python 3.10+ منفصلة، ثم ثبّت المتطلبات عبر pip install -r requirements.txt.
جمع الصور المرجعية الحاسمة: تحتاج 100 صورة سوداء نقية (#000000) و100 صورة بيضاء نقية (#FFFFFF) مولدة من Nano Banana Pro في Gemini. هذه الخطوة حرجة لدقة استخراج الترددات الحاملة.
بناء كتاب الأكواد الطيفي: استخدم الأمر build-codebook مع مجلدات الصور المرجعية والصور المعلّمة مائياً لإنشاء spectral_codebook_v3.npz الذي يحفظ ملفات تعريف متعددة الدقة.
تشغيل كاشف العلامة: طبّق detect على أي صورة للحصول على تقييم ثقة الكشف ونسبة احتمالية وجود العلامة المائية.
تطبيق الإزالة متعددة المراحل: اختر مستوى القوة من gentle (45 ديسيبل) إلى aggressive (43+ ديسيبل)، الأداة تنفذ طرح طيفي مباشر مع جدولة متعددة المراحل لالتقاط الطاقة المتبقية.
التحقق من المخرجات: قيّم النتائج عبر مقاييس PSNR للجودة و SSIM للتشابه الهيكلي، تأكد من انخفاض طاقة الترددات الحاملة بنسبة 75%+ وتراجع التماسك الطوري بنسبة 90%+.
معالجة الدقات غير المطابقة: للدقات غير الموجودة في كتاب الأكواد، الأداة تستخدم مسار fallback يعيد تحجيم الصورة مكانياً للدقة الأقرب قبل تطبيق الطرح الطيفي.

النتائج على 88 صورة من جيميناي بدقة 1536×2816 مثيرة للإعجاب: انخفاض طاقة الترددات الحاملة بنسبة 75.8%، تراجع التماسك الطوري للترددات الخمسة العليا بنسبة 91.4%، مع PSNR عند 43.5 ديسيبل و SSIM عند 0.997. للمطابقة الدقيقة في الدقة، ترتفع جودة PSNR إلى 44.9 ديسيبل.

ما يجعل هذا البحث مختلفاً عن المحاولات السابقة هو الفهم العميق لبنية العلامة المائية. بدلاً من الطرق العشوائية مثل ضغط JPEG أو حقن الضوضاء، تستهدف النسخة الثالثة ترددات محددة بدقة جراحية. كتاب الأكواد يحفظ مواضع الترددات، المقادير، والأطوار لكل دقة، ويطبق طرحاً مرجحاً بناءً على ثقة التماسك الطوري والتحقق المتقاطع.

التطبيق العملي واضح عبر واجهة سطر الأوامر البسيطة: python src/extraction/synthid_bypass.py bypass input.png output.png --strength aggressive. الأداة تكتشف دقة الصورة تلقائياً وتختار ملف التعريف المناسب، أو تلجأ للمسار الاحتياطي عند الحاجة.

رغم القوة التقنية للأداة، يؤكد الباحث على الاستخدام الأخلاقي للبحث الأكاديمي فقط. الهدف تحليل مقاومة أنظمة العلامة المائية الحالية وتطوير حلول أقوى مستقبلاً، وليس إخفاء هوية المحتوى المُولد بالذكاء الاصطناعي بطرق مضللة. للمطورين العرب، يقدم المشروع نظرة تقنية عميقة على هندسة أنظمة التوثيق وطرق تحليلها، مما يساعد في بناء حلول حماية محلية أكثر تطوراً.

المصدر