النماذج الأرخص تهدد اقتصاديات الذكاء الاصطناعي

🎧 استمع للملخص

بقلم: سارة | محررة نماذج الذكاء الاصطناعي · صوت تحريري بإشراف بشري

تقف صناعة الذكاء الاصطناعي على مفترق طرق مع تزايد الضغوط المالية التي تدفع الشركات للنظر بجدية أكبر نحو النماذج الأصغر والأرخص، مما قد يهدد الافتراض الأساسي الذي بُني عليه القطاع: أن النماذج الأكبر أقوى، والأقوى ينتصر.

هذا التحول نحو التسوق الواعي للتكاليف في اختيار النماذج ظاهرة جديدة تماماً، ولكن تأثيرها المحتمل كبير بما يكفي لإعادة تشكيل اقتصاديات الصناعة بأكملها. يتوقع برايان آرمسترونغ، المؤسس المشارك لـ Coinbase، أن 80% من أحمال العمل ستنتقل لنماذج أرخص بنسبة 99% خلال 12-18 شهراً، بينما 20% فقط ستبقى على نماذج الجيل الأحدث حيث تكون أقصى درجات الذكاء مطلوبة.

إذا تحققت هذه التوقعات، فإن التحول سيكون زلزالياً للصناعة. حتى الآن، تنافست معظم شركات الذكاء الاصطناعي على الجودة، مما عنى اللجوء افتراضياً للنماذج الأكثر تطوراً المتاحة. لكن إذا أمكن التعامل مع نفس المهام بنماذج أرخص دون التأثير على الجودة، فسيعني ذلك تحولاً هائلاً في اقتصاديات القطاع، وبشكل حرج، ستأتي معظم الوفورات من جيوب المختبرات الكبرى، مما يوجه ضربة مالية لـ OpenAI وAnthropic تماماً بينما يتجهان نحو الاكتتابات العامة.

الاختبارات الأولية تشير لإمكانية حدوث هذا التحول دون التضحية بالجودة. في اختبار حديث أجرته أداة Harvey للذكاء الاصطناعي القانوني بشراكة مع منصة Fireworks AI، تمكنت الشركة من خفض تكاليف الاستدلال 3 مرات دون تقليل الجودة، وذلك من خلال دمج Claude Opus مع GLM 5.1 من Fireworks والتحول لـ Opus فقط في المهام الأكثر كثافة.

“الجودة تأتي أولاً، وفي المجال القانوني ستبقى كذلك دائماً”، يقول غايب بيريرا، المؤسس المشارك لـ Harvey، “لكن تعريف الجودة يتطور من مجرد استخدام أقوى نموذج لكل شيء، إلى استخدام أفضل نموذج يحصل على الإجابة الصحيحة بأكثر الطرق كفاءة”.

هذا الاتجاه غالباً ما يُؤطر كصراع بين المختبرات الكبرى والنماذج الصينية أو مفتوحة الأوزان، لكن هذا يفوت النقطة الأكبر. الانقسام الحقيقي ليس بين النماذج المملوكة والمفتوحة، بل بين النماذج الكبيرة والصغيرة. يمكنك توفير المال بالتحول من GPT-5.5 إلى DeepSeek‘s V4 Flash، لكن التحول لـ GPT-5.4-mini يعمل بنفس الفعالية.

كل هذا قد يبدو بديهياً – بالطبع لا يجب أن تستخدم حوسبة أكثر من اللازم – لكنه يتعارض مع نهج “التوسع أولاً” الذي هيمن على الصناعة حتى الآن. مع ارتفاع أسعار الرموز المميزة وتباطؤ الإعانات، يواجه المستخدمون ضغطاً مالياً لأول مرة. إذا اتضح أن معظم التطبيقات يمكن تشغيلها بنفس الجودة على نموذج أصغر، فقد يضع ذلك عائقاً جدياً أمام النمو المتزايد للطلب على الاستدلال، ويثير أسئلة جديدة حول كيفية تبرير تكلفة تدريب نموذج متطور.

TechCrunch