أعلنت شركة أوبن إيه آي عن إصدار نموذجها الجديد لتوليد الصور الذي يحمل اسم Images 2.0، وهو يمثل خطوة مهمة في تقدم الذكاء الاصطناعي في مجال المحتوى البصري، حيث يركز بشكل خاص على تحسين دعم اللغة العربية داخل النظام.
هذا الإصدار يأتي كترقية مباشرة للنموذج السابق ChatGPT Images، لكن بفلسفة مختلفة؛ فبدلاً من كونه مجرد أداة لرسم الصور، أصبح شريكًا بصريًا يساعد المستخدمين في التفكير والتعبير من خلال الصور، مما يجعله امتدادًا لقدرات الدردشة النصية المعروفة.
وفقًا لما نشرته الشركة، يقدم Images 2.0 جيلًا جديدًا من نماذج الصور التي تفهم التعليمات المعقدة وتولد صورًا عالية الدقة، مع تحسين كبير في التعامل مع النصوص داخل الصور مقارنة بالإصدارات السابقة.
تحسين دقة النصوص ودعم لغات متعددة
ركزت أوبن إيه آي على تحسين دقة النصوص داخل الصور، وهي مشكلة كانت تؤرق العديد من أدوات توليد الصور في السابق، حيث كانت النماذج السابقة تنتج نصوصًا مشوهة أو غير مفهومة، مما جعلها غير مناسبة للاستخدام في مشاريع حقيقية.
مع Images 2.0، أعلنت الشركة أن دقة الكتابة وصلت إلى نحو 99% في اختبارات معيارية خاصة بالنصوص، مع قدرة النموذج على التعامل مع أكثر من 48 لغة بما في ذلك العربية، مما يتيح كتابة عناوين وجمل كاملة بخط واضح.
هذا التطور يجعل النموذج أقرب لأدوات التصميم التجارية، حيث يمكن استخدامه في إنشاء شعارات ومنشورات تسويقية ومحتوى بصري جاهز للنشر.
دعم أفضل للغة العربية وتجربة مستخدم محسّنة
من المثير للاهتمام أن أوبن إيه آي تكرر ذكر اللغة العربية في بياناتها، حيث تؤكد أن النموذج الجديد يقدم دعمًا أفضل للغات غير الإنجليزية، مع تحسينات واضحة في التعامل مع العربية سواء في النصوص أو فهم الأوامر المكتوبة.
هذا يعني أن المستخدم يمكنه كتابة طلبه بالعربية، مثل وصف مشهد أو فكرة تصميم، ليقوم النموذج بتحويله إلى صورة قريبة من الفكرة الأصلية، مع إدراج نصوص عربية سليمة داخل التصميم.
كما أن النموذج أصبح يفهم السياق الثقافي واللغوي بصورة أفضل، مما يجعله أكثر دقة في الاستجابة لطلبات تتعلق بأنماط عربية معينة مثل الخط الديواني أو الزخرفة الإسلامية.
قدرات استدلال بصري أفضل
بجانب تحسينات اللغة، يتضمن Images 2.0 قدرات أفضل في ما تسميه أوبن إيه آي “الاستدلال البصري”، أي فهم محتوى الصورة نفسها وتحليلها وربطها بما يطلبه المستخدم.
يمكن للمستخدم رفع صورة معينة، ثم يطلب من النموذج اقتراح تصميمات جديدة أو تغيير الخلفية، أو حتى توليد مشاهد كاملة بطريقة منطقية ومتناسقة.
النموذج قادر أيضًا على التعامل مع تعليمات طويلة ومتعددة الخطوات، مما يجعل تجربة المستخدم أكثر سلاسة وكأنها تتعامل مع مصمم بشري يفهم الفكرة الكاملة.
تكامل مع ChatGPT وواجهات التطوير
يتم تقديم Images 2.0 داخل تجربة ChatGPT، مما يسمح للمستخدم بالانتقال بسهولة من الحوار النصي إلى توليد الصور ثم العودة للنقاش حول ما تم إنتاجه.
يمكن للمستخدم مثلاً طلب المساعدة في صياغة فكرة حملة إعلانية، ثم توليد نماذج بصرية للشعار أو المنشور، ومناقشة التفاصيل بعد ذلك.
بالنسبة للمطورين، توفر الشركة واجهة برمجة تطبيقات جديدة تحت اسم gpt-image-2، مما يسمح بدمج قدرات النموذج داخل تطبيقات ومواقع خارجية.
هذا التكامل يعني أن المستخدم النهائي قد يستفيد من Images 2.0 دون الحاجة للتعامل معه مباشرة، بل من خلال خدمات تعتمد عليه في الخلفية.
فرص جديدة لصنّاع المحتوى العرب
مع التحسينات في دعم اللغة العربية، تفتح أوبن إيه آي أبوابًا واسعة للاستخدامات في المنطقة، من صناع المحتوى الأفراد إلى المؤسسات الإعلامية والشركات الناشئة.
يمكن للمصممين الاستفادة من النموذج لإنتاج أفكار بصرية أولية بسرعة، مما يوفر الوقت والجهد، كما يمكن لقنوات يوتيوب وصفحات إنستجرام الاعتماد عليه في توليد صور مصغرة أو منشورات تعريفية.
لكن تبقى هناك تساؤلات حول حقوق الاستخدام ودقة توليد بعض الأنماط العربية الحساسة، وهي قضايا تعمل الشركة على تحسينها عبر سياسات أمان وتصفية محتوى محدثة.
بشكل عام، يبدو أن إطلاق Images 2.0 يمثل خطوة جديدة نحو جعل أدوات الذكاء الاصطناعي البصري جزءًا من أدوات المبدع العربي، مما يساعد في تعزيز المحتوى العربي في مختلف المجالات.

