
بقلم: يوسف | محرر أدوات الذكاء الاصطناعي · صوت تحريري بإشراف بشري
تقدم ChatGPT Images 2.0 من OpenAI إعادة تعريف جذرية لمفهوم توليد الصور بالذكاء الاصطناعي، حيث يتخطى النموذج حدود إنتاج “الصور الجميلة” ليصبح أداة عمل إبداعي حقيقية مزودة بـمحرك استدلال مدمج يفكر قبل التنفيذ.
القدرة الأبرز تكمن في آلية التفكير المسبق التي تمكن النموذج من تحليل الطلبات وتخطيط المخرجات والتحقق من التفاصيل واستخدام السياق من الويب عند الضرورة. هذا التطور التقني يتيح إنتاج 8 متغيرات من الصورة الواحدة (وفقاً للمصدر الأصلي) مع الحفاظ على اتساق مثالي للشخصيات والعناصر والأسلوب البصري عبر جميع النتائج.

على مستوى التحسينات التقنية، يقدم النموذج عرض نصوص محسّن بشكل جذري للغات غير اللاتينية شاملاً اليابانية والكورية والصينية والهندية والبنغالية. كما يحتوي على قاعدة معرفة محدثة حتى ديسمبر 2025 (وفقاً للمصدر)، إضافة إلى قدرة متطورة على تكرار الأساليب البصرية بدقة تشمل الملمس والإضاءة والتكوين والمزاج.
هذه القدرات تجعل النموذج مناسباً بشكل خاص لأعمال العلامات التجارية حيث يمكن إنتاج شعارات ولقطات منتجات وحملات متسقة بصرياً. المصممون والمسوقون يحصلون الآن على أداة قادرة على فهم متطلبات الهوية البصرية والحفاظ عليها عبر مجموعات كاملة من المحتوى.
النتيجة المباشرة لهذه التطويرات ظهرت في تصدر ChatGPT Images 2.0 لـتصنيفات Image Arena متفوقاً على منافسين راسخين مثل Nano Banana 2 (وفقاً للمصدر). هذا الإنجاز يعكس تطوراً حقيقياً في جودة المخرجات وليس مجرد تسويق.
من ناحية الإتاحة، النموذج الأساسي متوفر لمستخدمي ChatGPT وCodex، بينما تقتصر المخرجات المتقدمة المعتمدة على الاستدلال على خطط Plus وPro وBusiness وEnterprise. هذا التدرج في الخدمات يشير إلى أن OpenAI تعتبر قدرات الاستدلال ميزة متميزة تستحق التسعير المتدرج.
رغم الإعلانات الواعدة، تبقى تفاصيل تقنية مهمة غامضة. OpenAI لم توضح آلية عمل “التفكير قبل التوليد” بدقة، ولا تأثير ذلك على أزمنة الاستجابة. كما أن معايير اتخاذ القرار حول متى يستخدم النموذج السياق من الويب تحتاج توضيحاً أكبر لفهم مدى موثوقية وشفافية عملية الاستدلال.







