يشهد عالم الذكاء الاصطناعي مرحلة مفصلية تتسارع فيها الابتكارات بوتيرة غير مسبوقة، حيث لم تعد المنافسة تقتصر على الدردشة النصية، بل امتدت بقوة إلى تحرير الصور، الفهم متعدد الوسائط، وسرعة الاستجابة. وفي هذا السياق، كشفت OpenAI عن تقنيتها الجديدة GPT Image 1.5، بينما ردّت Google بخطوات جريئة عبر نموذج Gemini 3 Flash، لتدخل الساحة مرحلة أكثر سخونة ونضجًا.
ثورة OpenAI في تحرير الصور مع GPT Image 1.5
أحدثت OpenAI نقلة نوعية في مجال معالجة الصور بإطلاق GPT Image 1.5، وهو نموذج يركّز على الجمع بين السرعة العالية والدقة الفائقة. فبحسب الإعلان الرسمي، أصبح النموذج أسرع بما يصل إلى أربعة أضعاف مقارنة بالإصدارات السابقة، مع قدرة محسّنة على فهم الأوامر النصية المعقدة وتحويلها إلى صور عالية الجودة في وقت قياسي.
الميزة الأبرز في هذا الإصدار تتمثل في مفهوم “التعديل الهادف”، حيث لم يعد تعديل جزء من الصورة يعني تشويهها بالكامل. يمكن للمستخدم الآن تغيير عناصر محددة مثل الملابس أو تسريحة الشعر أو الأسلوب الفني، مع الحفاظ على البنية الأصلية للصورة وتفاصيلها الجوهرية. هذا التطور حلّ واحدة من أقدم المشكلات في أدوات توليد الصور، ومنح المبدعين تحكمًا أدق وأكثر احترافية.
ولتعزيز التجربة، حصلت واجهة ChatGPT على تحديثات عملية، أبرزها إضافة تبويب “الصور” الذي يوفّر فلاتر جاهزة وأفكارًا إبداعية تسهّل على المبتدئين والمحترفين على حد سواء الانطلاق بسرعة، وتحويل الأداة من بيئة نصية تقليدية إلى مساحة بصرية تفاعلية أقرب إلى استوديو تصميم متكامل.
Gemini 3 Flash: النموذج السريع الذي أربك الحسابات
على الجانب الآخر، لم تقف جوجل موقف المتفرج. فقد أظهرت نتائج الاختبارات أن نموذج Gemini 3 Flash، رغم كونه نموذجًا اقتصاديًا وسريعًا، حقق أداءً لافتًا في اختبار MMMU-Pro المعياري، المخصص لقياس الفهم والاستدلال متعدد الوسائط. سجل النموذج نسبة 81.2%، متفوقًا على GPT-5.2 الذي حقق 79.5%.
صحيح أن الاختبارات المعيارية لا تعكس دائمًا التجربة الواقعية الكاملة، وأن الحكم النهائي يبقى بيد المستخدمين، إلا أن اقتراب نموذج “خفيف وسريع” من هذا المستوى — بل وتفوقه — يُعد رسالة واضحة بأن المنافسة لم تعد حكرًا على النماذج الضخمة فقط، بل أصبحت الكفاءة والسرعة عاملين حاسمين في المعادلة.
استراتيجية جوجل: الذكاء الاصطناعي المتقدم للجميع
في خطوة استراتيجية جريئة، أعلنت جوجل أن Gemini 3 Flash سيكون النموذج الافتراضي داخل تطبيق Gemini، وكذلك في قسم “وضع الذكاء الاصطناعي” ضمن بحث جوجل. هذا القرار يعني أن ملايين المستخدمين حول العالم سيحصلون على قدرات ذكاء اصطناعي متقدمة بشكل مجاني.
ولتعزيز هذا التوجه، كشفت الشركة عن أداة جديدة لإنشاء الصور باسم Nano Banana Pro، متاحة حاليًا لمستخدمي الولايات المتحدة عبر إعدادات روبوت الدردشة. بهذه الخطوات، توضح جوجل نيتها رفع سقف التوقعات لما يمكن أن يقدمه الذكاء الاصطناعي المجاني، ومنافسة الحلول المدفوعة بشكل مباشر.
مشهد جديد للمنافسة
بين استوديو الإبداع الذي تقدمه OpenAI عبر GPT Image 1.5، والنموذج السريع الذي تدفع به جوجل إلى الواجهة مع Gemini 3 Flash، يتضح أن سوق الذكاء الاصطناعي يدخل مرحلة جديدة أكثر نضجًا. لم يعد التفوق مرتبطًا بالقوة الخام وحدها، بل بالتوازن بين الأداء، السرعة، وسهولة الوصول.
ومع هذا التصعيد المتبادل، يبدو أن المستفيد الأكبر هو المستخدم النهائي، الذي سيحصل على أدوات أكثر ذكاءً، أسرع، وأقرب إلى احتياجاته اليومية — سواء في الإبداع البصري أو في الفهم العميق للمحتوى متعدد الوسائط.
