ميزة “DALL·E 3”.. نقلة جديدة في صناعة الصورة

  • 2023/10/29
  • 11:00 ص
صورة شخصية معدلة عن طريق الذكاء الاصطناعي - 28 من تشرين الأول ( عبد المعين حمص / عنب بلدي)

صورة شخصية معدلة عن طريق الذكاء الاصطناعي - 28 من تشرين الأول ( عبد المعين حمص / عنب بلدي)

شكّل تطور برامج تقنية “DALL·E” نقلة نوعية في تنوع وإظهار ميزات برامج الذكاء الاصطناعي، عبر ترجمة الأفكار بسهولة إلى صور دقيقة بشكل استثنائي.

يعرف “DALL-E 3” بأنه نموذج تم تطويره حديثًا بواسطة شركة “OpenAI”، ويمكنه إنشاء صور مفصلة وواقعية للغاية بناء على مطالبات مكتوبة، ويقوم بتقييم قاعدة بيانات واسعة للصور وصياغة المرئيات ذات الصلة بمساعدة نص الإدخال.

ومن المقرر أن يكون “DALL.E 3” متاحًا لعملاء “ChatGPT Plus” و”Enterprise” في شهر تشرين الثاني المقبل.

وذكر باحثون في “OpenAI” المدعومة من “مايكروسوفت”، أن النسخة الجديدة “DALL.E 3” توفر صورًا أكثر دقة مما كان يتم الحصول عليه في النسخة “DALL.E 2” السابقة.

وتميل بعض برامج أنظمة تحويل النص إلى صورة إلى تجاهل الكلمات أو الأوصاف المعبر عنها، ما يصعب على المستخدمين تنفيذ أعمالهم بشكل أبسط وأسرع، أما “DALL·E 3” فيقوم بإنشاء صور تلتزم تمامًا بالنص المقدم إليه.

ووفرت “OpenAI” ميزة “DALL·E 3” لمستخدميها عن طريق الإصدار المأجور فقط، كما تم إنشاء التطبيق مدمجًا بـ”ChatGPT”، متيحًا استخدامه كشريك لتبادل الأفكار وتحسين مطالب الأشخاص.

كما يقوم “ChatGPT” تلقائيًا بإنشاء الطلبات المخصصة والمدخلة من قبل الأشخاص على الـ”DALL·E 3″.

ومن ميزات التطبيق، أن الصور التي يتم إنشاؤها عبره تعود ملكيتها للمنشئ، ولا تحتاج إلى إذن لإعادة طباعتها أو بيعها أو حتى تسويقها.

واتخذ “DALL·E 3” خطوات للحد من القدرة على إنشاء محتوى عنيف أو للبالغين أو محتوى يحض على الكراهية.

وتخطط “OpenAI” لتحليل كيفية ارتباط نماذج مثل “DALL·E 3” بالقضايا المجتمعية، كالتأثير الاقتصادي على عمليات عمل ومهن معينة، واحتمال التحيز في مخرجات النموذج، والتحديات الأخلاقية طويلة المدى التي تنطوي عليها هذه التكنولوجيا.

أُسست شركة “OpenAI” المنتجة لـ”DALL·E 3″ عام 2015، من قبل مجموعة من رواد التكنولوجيا، بينهم الملياردير الأمريكي الشهير إيلون ماسك مالك تطبيق “إكس” (تويتر سابقًا)، بالإضافة إلى سام ألتمان الذي يقود الشركة حاليًا.

تنافس في البرامج وميزة مأجورة

“كانفا ” (Canva)

أصدرت “كانفا” (Canva) في تشرين الثاني لعام 2022 أداة جديدة في التصميم للمستخدمين لتحويل النصوص إلى صور.

وكانت “كانفا” من أوائل البرامج التي أصدرت ميزة تحويل النصوص إلى صور مرئية والعديد من الميزات في تحديث وتطوير تطبيقها.

وتعتمد ميزة تحويل النصوص إلى صور (text-to-image) على نموذج الذكاء الاصطناعي مفتوح المصدر، بالإضافة إلى واجهة مخصصة تتوافق مع تصميم “كانفا” لمساعدة المستخدم في إنشاء الصور بسهولة من النصوص واستخدامها في التصميمات المختلفة، ما يمنح المستخدمين أداة إضافية تساعدهم في التصميم.

وتتوفر أداة تحويل النصوص إلى صور لمستخدمي الإصدار المأجور فقط.

“أدوبي ” (Adobe – Generative Fill)

أعلنت شركة “أدوبي” (Adobe)، في أيار الماضي، عن دمج تقنية الذكاء الاصطناعي مع ميزة “الملء التأسيسي” (Generative Fill) في “فوتوشوب” (Photoshop).

وتساعد هذه الميزة في تحقيق رؤية المصمم بشكل أسرع، مع توفير التحكم الكامل على كل تصميم.

وتتيح ميزة “الملء التأسيسي” (Generative Fill) المدعومة من “Firefly” للمستخدمين تحسين المحتوى أو توسيعه أو حتى إزالة أي جزء من الصور باستخدام أوامر نصية بسيط فقط.

ويتميز “الملء التأسيسي ” (Generative Fill) بميزات كثيرة، أبرزها توليد الأفكار، وتوليد الخلفيات، وتمديد الصور، وإزالة الزوائد.

وتتجاوز الخاصية كونها مجرد إنشاء محتوى، حيث تقوم تلقائيًا بمطابقة المنظور والإضاءة والتعبئة التلقائية وغيرها من الخصائص.

كما يجب أن يتوفر لديك الإصدار رقم 25.0 من “فوتوشوب” المأجور للوصول إلى خاصية الـ”Generative Fill” (الملء التأسيسي).

“ميدجورني” (Midjourney)

يعمل تطبيق “ميدجورني” (midjourney) على انشاء صور بناء على ما تتم كتابته ووصفه من قبل الشخص، عن طريق خاصية الذكاء الاصطناعي.

يختلف تطبيق “ميدجورني” عن تطبيقات الذكاء الاصطناعي للمحادثة الأخرى مثل “شات جي بي تي” (ChatGPT) وغيره من التطبيقات التي تم إصدارها مؤخرًا.

أطلق “ميدجورني” نسخته الخامسة، ما أدى إلى تحسين وتطوير خدماته بشكل أكبر، إلا أنه لا يزال حتى الآن لديه بعض القيود التكنولوجية.

يُستخدم بشكل مجاني محدود بعدد معين من الاستخدامات اليومية مع وجود بعض القيود عليه، ويفضل استخدامه باللغة الإنجليزية لأداء أفضل.

كما يعمل تطبيق “ميدجورني” بالاشتراك حصرًا مع تطبيق “ديسكورد” (Discord) وإنشاء حساب بقناته https://discord.com/invite/midjourney.

بدأت تقنيات تحويل النصوص إلى صور التي تعتمد على تقنيات الذكاء الاصطناعي “AI” والتعلم الآلي “ML” بالانتشار من عام 2022 وحتى العام الحالي، مع إطلاق شركة “OpenAI” تقنيتها المتطورة “DALL-E”.

كما أعلنت مايكروسوفت عن تطبيق جديد للتصميم يعتمد عليها باسم “Microsoft Designer”، بالإضافة إلى توفر نموذج “Stable Diffusion” مفتوح المصدر، الذي سهل توفير مزيد من ميزات الأداة في تطبيقاتها وخدماتها المختلفة.

اقرأ أيضًا: كيف تحصل على نتائج مقبولة منروبوتاتالدردشة

مقالات متعلقة

تكنولوجيا

المزيد من تكنولوجيا