“سورا”.. الانتقال لصناعة الفيديو استنادًا إلى تعليمات نصية

  • 2024/03/03
  • 2:59 م
"سورا".. الانتقال لصناعة الفيديو استنادًا إلى تعليمات نصية

صورة توضيحية لتقنية سورا لتحويل النص إلى فيديو من شركة “OpenAI”- 20 من شباط 2024 (ginmedia)

أعلنت شركة “OpenAI” عن إطلاق تقنية جديدة تحمل اسم “Sora” (سورا)، التي تعد نموذجًا ذكيًا يقوم بإنشاء مشاهد واقعية وخيالية استنادًا إلى تعليمات نصية فقط.

تهدف هذه التقنية إلى تعليم الذكاء الاصطناعي وفهم محاكاة العالم الحقيقي بحركته، بهدف تدريب النماذج التي تساعد الأشخاص في حل المشكلات التي تتطلب تفاعلًا واقعيًا.

“سورا”، قادرة على إنشاء فيديوهات تصل إلى دقيقة واحدة، مع الحفاظ على جودة الصورة والانسجام عن طريق تعليمات المستخدم.

يتمتع النموذج بفهم عميق للغة، ما يمكنه من تفسير التعليمات بدقة وإنشاء شخصيات جذابة تعبر عن مشاعر حية.

يمكن أيضًا لـ”سورا” إنشاء عدة لقطات داخل فيديو واحد مولد، يحافظ بدقة على شخصياته وأسلوبه البصري.

ويشير الباحثون إلى أن “سورا” قادرة على إنشاء مشاهد معقدة تضم عدة شخصيات، وأنواعًا محددة من الحركة، وتفاصيل دقيقة للموضوع والخلفية.

ولا يقتصر فهم “سورا” على ما يطلبه المستخدم في التعليمات فقط، بل بكيفية وجود تلك الأشياء ودورها في العالم الحقيقي.

أمان عالٍ ونقاط ضعف

تشمل خطوات أمان تقنية “سورا” إنشاء أدوات تساعد في اكتشاف المحتوى الخادع، مثل مصنف الكشف الذي يستطيع التعرف على الفيديوهات التي تم إنشاؤها بواسطة “سورا”.

وترفض “OpenAI” التعامل مع تعليمات الإدخال النصي الذي ينتهك سياسة الأمان الموضوعية، مثل التعليمات التي تطلب العنف المتطرف، أو المحتوى الجنسي، أو صورًا عن محتوى الكراهية، أو الملكية الفكرية للآخرين، وغيرها.

كما طورت الشركة مصنفات الصور القوية التي تستخدم لمراجعة إطارات كل فيديو يتم إنشاؤه بواسطة “سورا”، بهدف ضمان التزامها بسياسات الاستخدام قبل عرضه للمستخدم.

وتأتي هذه الخطوات في إطار جهود الشركة لضمان سلامة استخدام التقنية، إذ تعمل “سورا” مع فرق التدقيق الأمني وتطوير أدوات للكشف عن المحتوى المضلل.

وستتيح الشركة استخدام الأداة الجديدة “سورا” لعدد محدود من مبتكري المحتوى في إطار المرحلة التجريبية، وفق ما نشره رئيس “OpenAI”، سام ألتمان، في صفحته الشخصية عبر منصة “إكس”.

ويعاني النموذج الحالي من “سورا” من بعض نقاط ضعف، بحيث يمكن أن يجد صعوبة في محاكاة لمشهد معقد، بالإضافة إلى عدم فهمه لحالات معينة بشكل دقيق، مثل الالتباس بين اليسار واليمين أو عدم القدرة على الحفاظ على الاستمرارية البصرية طوال الفيديو، بحسب الموقع الرسمي لـ”OpenAI”.

تعد “سورا” خطوة مهمة نحو تحقيق الذكاء الاصطناعي الشامل، إذ تشكل أساسًا للنماذج التي يمكنها فهم ومحاكاة العالم الحقيقي، وهي تقنية يتوقع أن تلقى استحسانًا واسعًا في المجتمع العلمي والتقني بشأن الذكاء الاصطناعي العام.

مقالات متعلقة

تكنولوجيا

المزيد من تكنولوجيا