تُحدَّث يومياً

مصدرُك العربي
لمستقبل الذكاء الاصطناعي

أخبار، تقارير، أدوات وتحليلات يومية — كل ما تحتاجه لمتابعة ثورة الذكاء الاصطناعي باللغة العربية

✅ تم الاشتراك!
الإحصائيات والتقارير

دراسة 815 ألف صفحة تكشف فشل “الأدلة الشاملة” في ChatGPT

🎧 استمع للملخص

بقلم: نور | محررة الأبحاث والدراسات · صوت تحريري بإشراف بشري

الصفحات التي تغطي 26-50% من الموضوعات الفرعية تحصل على اقتباسات في ChatGPT أكثر من تلك التي تغطي 100% منها (وفقاً لـ Growth Memo). هذا ما كشفته دراسة ضخمة شملت 815,000 زوج من الاستفسارات والصفحات عبر 16,851 استفساراً و353,799 صفحة في 10 صناعات مختلفة.

الدراسة، التي أجراها كيفن إنديغ بالتعاون مع AirOps، تدحض عقوداً من افتراضات SEO التقليدية. بدلاً من “كلما زاد المحتوى زادت الفرصة”، تظهر البيانات أن المقالة المركزة التي تعالج 2-3 زوايا بعمق تتفوق على “الدليل الشامل” الذي يحاول تغطية كل زاوية ممكنة.

شركة AirOps أجرت 16,851 استفساراً عبر ChatGPT ثلاث مرات لكل منها، مسجلة كل استفسار فرعي، كل رابط مُسترجع، كل اقتباس مُنتج، وكل صفحة مُحللة. كل استفسار ولّد متوسط استفسارين فرعيين، واسترجع ChatGPT حوالي 10 روابط لكل بحث فرعي قبل اختيار ما يُقتبس منه. قاس الباحثون مدى تطابق العناوين الفرعية H2-H4 لكل صفحة مع تلك الاستفسارات الفرعية باستخدام cosine similarity على نموذج bge-base-en-v1.5.

  1. ترتيب الاسترجاع هو العامل الأقوى: الصفحة في المرتبة 0 (أول رابط يُستخرج بأداة بحث ChatGPT) لديها 58% معدل اقتباس. بالمرتبة 10، تنخفض النسبة إلى 14%. الصفحات المُقتبسة في الجلسات الثلاث جميعها حققت متوسط ترتيب 2.5، بينما الصفحات غير المُقتبسة أبداً حققت متوسط ترتيب 13.
  2. مطابقة الاستفسار تحدد النجاح: الصفحات التي تحتوي عناوين بتطابق 0.90+ مع الاستفسار تحصل على 41% معدل اقتباس مقارنة بـ 30% للصفحات تحت 0.50. حتى بين الصفحات عالية الترتيب (مراتب 0-2)، المطابقة الأعلى تضيف 19 نقطة مئوية.
  3. التغطية الشاملة تضر بالأداء: الصفحات التي تغطي 26-50% من الاستفسارات الفرعية تتفوق على تلك التي تغطي 100%. استراتيجية “الدليل الشامل” تنتج نتائج أسوأ من المقال المركز الذي يغطي ربع الموضوعات الفرعية بعمق.
  4. سلطة النطاق لا تتنبأ بشيء: الصفحات المُقتبسة دائماً لديها سلطة نطاق أقل من الصفحات غير المُقتبسة أبداً. عدد الكلمات (~2,200 للمجموعتين)، عدد العناوين (~20 للمجموعتين)، ودرجات القابلية للقراءة (~12 FK grade) متشابهة تقريباً.
  5. ويكيبيديا تكسر كل القواعد: رغم أسوأ ترتيب استرجاع في البيانات (متوسط 24) وأدنى درجة مطابقة استفسار (0.576)، تحقق 59% معدل اقتباس. صفحاتها تبلغ متوسط 4,383 كلمة، 31 قائمة، و6.6 جداول – مستوى شمولية موسوعية لا يمكن لناشر تجاري مضاهاته.
  6. الواقع ثنائي القطب للاقتباسات: 58% من الصفحات المُسترجعة لا تُقتبس أبداً، 25% تُقتبس دائماً عند الظهور، 17% فقط تقع في المنطقة الوسطى. الصفحات “المختلطة” تمتلك أعلى عدد كلمات، أكثر العناوين الفرعية، وأعلى سلطة نطاق – هي “الأدلة الشاملة” بعينها، وهي الأقل موثوقية في الأداء.
جدول يوضح توزيع معدلات الاقتباس حسب ترتيب الاسترجاع في ChatGPT
انخفاض حاد في معدلات الاقتباس مع تراجع ترتيب الاسترجاع

النتائج تقلب الحكمة التقليدية لكتابة محتوى SEO. عوضاً عن “المزيد من الموضوعات الفرعية، المزيد من الأقسام، المزيد من الكلمات”، تشير البيانات إلى أن المحتوى الأكثر تركيزاً يفوز. الصفحات الفائزة باستمرار تطابق الاستفسار مباشرة في عناوينها، تميل إلى القصر (النقطة المثلى 500-2,000 كلمة)، وتمتلك هيكلة كافية (7-20 عنوان فرعي) لتنظيم المحتوى دون تمييعه.

استراتيجية “بناء الصفحة الأفضل لسؤال واحد” تتفوق على “الصفحة المقبولة لعشرين سؤالاً”. هذا لا يعني تجاهل الشمولية، بل إعادة تعريفها من “تغطية كل شيء” إلى “تغطية الشيء الصحيح بالعمق المناسب”. المحتوى المركز يحقق نتائج أكثر اتساقاً من المحتوى المبعثر عبر عشرات الموضوعات الفرعية.

تحدي الدراسة الأكبر يكمن في فهم نظام الاسترجاع الداخلي لـ ChatGPT. الخوارزمية التي تقرر أي صفحة تظهر في أي ترتيب تبقى صندوقاً أسود، لكن تأثيرها على معدلات الاقتباس النهائية هائل. التحسين لنظام الاسترجاع – وليس فقط لجودة المحتوى – يصبح المعركة الحقيقية في عصر الذكاء الاصطناعي.

Growth Memo

مقالات ذات صلة

زر الذهاب إلى الأعلى