تطبيقاتمقالاتمواقع

سورا من OpenAI: ثورة في عالم توليد الفيديو بالذكاء الاصطناعي يُغيّر قواعد اللعبة

اكتشف سورا من OpenAI: مُولد فيديو ثوري يُقدم إمكانيات لا حصر لها لإنشاء محتوى مرئي فريد باستخدام تقنيات ذكاء اصطناعي متقدمة.

مع اقتراب سرعة تطور الذكاء الاصطناعي من الإدراك البشري، فإن سورا من OpenAI، الذي يحول المطالبات النصية إلى مقاطع فيديو، يفاجئ العالم بطريقة حدوث الأشياء بشكل أسرع مما توقعه أي شخص.أحدث تقنيات الذكاء الاصطناعي. وكل ذلك في عالم يعتمد على الفيديو، أصبحت أدوات إنشاء الفيديو وتحريره ذات أهمية متزايدة. ومع ذلك، لا تزال عملية تحرير الفيديو صعبة وتستغرق وقتًا طويلاً، خاصة بالنسبة للمبتدئين.

سورا من OpenAI هي تقنية مبتكرة تهدف إلى تحويل وتحرير مقاطع الفيديو بكفاءة وإبداع. ويثير هذا النموذج تساؤلات حول مدى تأثيره على صناعة الفيديو، ولكن هل سيساعد في تغيير طريقة إنتاج الفيديو وتحريره إلى الأبد؟، في هذا المقال نستكشف مفهوم سورا من OpenAI وإمكانياته المحتملة، ونلقي نظرة على تأثيره على صناعة الفيديو وما يعنيه هذا الابتكار لكل من المستخدمين والمبدعين.

ما هو سورا من OpenAI؟

على غرار نماذج الذكاء الاصطناعي التوليدية الأخرى مثل DALL-E وميدجورني. يأخذ سورا الإشارات النصية من المستخدم ويترجمها إلى بيئة مرئية. ومع ذلك، على عكس مولدات الصور المدعومة بالذكاء الاصطناعي المذكورة أعلاه. ينتج سورا مقاطع فيديو مليئة بالحركة والزوايا والاتجاهات المختلفة وكل ما تتوقعه من مقطع فيديو تقليدي.

بالنظر إلى الأمثلة الموجودة على موقع سورا الإلكتروني، غالبًا ما يتعذر تمييز النتائج عن مقاطع الفيديو الحقيقية المنتجة بشكل احترافي. حيث يقدم كل شيء بدءًا من تصوير الطائرات بدون طيار المتطورة وحتى إنتاج الأفلام واسعة النطاق بملايين الدولارات والتي تضم ممثلين تم إبداعهم باستخدام الذكاء الاصطناعي والمؤثرات الخاصة والأعمال الفنية.

ما هو سورا من OpenAI؟

وبطبيعة الحال، سورا ليست التكنولوجيا الأولى التي تفعل ذلك. حاليًا، الشركة الرائدة في هذا المجال هي RunwayML، التي تقدم خدماتها للجمهور مقابل رسوم. ومع ذلك، حتى في أفضل الظروف، تكون لقطات Runway أقرب إلى اللقطات الأصلية من لقطات ميدجورني. لا يوجد تثبيت للصورة والفيزياء غير منطقية. حتى كتابة هذه السطور، يبلغ طول المقطع الأطول حوالي 16 ثانية.

بدلاً من ذلك، فإن أكبر قيمة يمكن أن يقدمها سورا هي الثبات التام، مع فيزيائية دقيقة (في أذهاننا على الأقل) ومقاطع تدوم لمدة تصل إلى دقيقة. وعلى الرغم من أن المقطع عديم الصوت تمامًا، إلا أن هناك بالفعل أنظمة ذكاء اصطناعي أخرى يمكنها إنشاء الموسيقى والمؤثرات الصوتية والصوتية. لذلك ليس لدي أدنى شك في أنه يمكن دمج هذه الأدوات في سير عمل سورا، أو في أسوأ الأحوال، التعليق الصوتي التقليدي.

ويل سميث وهو يتناول السباغيتي

من الصعب المبالغة في تقدير حجم القفزة الكبيرة التي حققها سورا من OpenAI من فيديو الذكاء الاصطناعي الكابوسي للعرض التوضيحي لـ سورا قبل عام واحد فقط. مثل هذا الفيديو المزعج للغاية الذي يصور الذكاء الاصطناعي ويل سميث وهو يتناول السباغيتي.

أعتقد أن هذه صدمة أكبر للنظام مما كانت عليه عندما تحولت مولدات الصور المدعومة بالذكاء الاصطناعي من مزحة إلى رعب وجودي مذهل في أذهان الفنانين التشكيليين.

يتمتع سورا من OpenAI بالقدرة على التأثير على صناعة الفيديو بأكملها. بدءًا من المبدعين الفرديين وحتى مستوى المشاريع ذات الميزانيات الكبيرة في ديزني ومارفل. لا شيء يمكن أن ينجو من هذا.

أعتقد أن هذا صحيح بشكل خاص لأن سورا يسمح لك بالعمل باستخدام المواد الموجودة، مثل تحريك الصور الثابتة المقدمة لك. بدلاً من الاضطرار إلى إنشاء شيء ما من من البداية. قد تكون هذه هي البداية الحقيقية لصناعة الأفلام التي تعتمد على الذكاء الاصطناعي.

كيف يعمل سورا؟

سأحاول التعمق في شخصية سورا بقدر ما أستطيع، لكن لا يمكنني الخوض في الكثير من التفاصيل.

أولاً، من المفارقات أن شركة OpenAI ليست منفتحة فيما يتعلق بالأعمال الداخلية لتقنيتها. نظرًا لأنها مملوكة لهم، فإننا لا نعرف تفاصيل الصلصة السرية التي تميز سورا من OpenAI عن منافسيها.

ثانيًا، أنا لست عالم كمبيوتر، وربما أنت لست كذلك، لذا لا أستطيع أن أفهم إلا من منظور عام وواسع لطريقة عمل هذه التكنولوجيا.

والخبر السار هو أن مايك يونغ لديه دليل رائع حول سورا على Medium، استنادًا إلى تقرير OpenAI الفني. لقد تم تقسيم هذا التقرير لتسهيل فهمه بالنسبة لنا نحن الأشخاص العاديين. كلتا الوثيقتين تستحقان القراءة، ولكن يتم تسليط الضوء على النقاط الأكثر أهمية هنا.

يعتمد سورا على الدروس التي تعلمها OpenAI عند إنشاء نماذج مثل ChatGPT وDALL-E. اكتشف OpenAI طريقة لتدريب سورا من نماذج مقاطع الفيديو عن طريق تقسيمها إلى “تصحيحات”، على غرار “الرموز المميزة” المستخدمة في نموذج تدريب ChatGPT. جميع هذه الرموز لها نفس الحجم، لذا فإن طول المقطع ونسبة العرض إلى الارتفاع وحجم الدقة وما إلى ذلك لا يهم سورا.

يستخدم سورا نفس أسلوب التحويل الشامل المستخدم في GPT، جنبًا إلى جنب مع طرق النشر المستخدمة في مولدات صور الذكاء الاصطناعي.

أثناء التدريب، نقوم بفحص رموز التصحيح الموزعة جزئيًا من مقطع فيديو ونحاول التنبؤ بالشكل الذي ستبدو عليه الرموز المميزة بدون ضوضاء. ومن خلال مقارنة ذلك بالحقيقة الأرضية، يتعلم النموذج “لغة” الفيديو. ولهذا السبب تبدو أمثلة مواقع سورا أصلية جدًا.

قدرة سورا على محاكاة الفيزياء

بالإضافة إلى هذه القدرة المذهلة، يتمتع سورا أيضًا بتعليقات توضيحية مفصلة للغاية لإطارات الفيديو التي استخدمها للتدريب. وهو ما يقطع شوطًا طويلاً في شرح سبب قدرته على تحرير مقاطع الفيديو التي ينشئها بناءً على المطالبات النصية.

ويبدو أن قدرة سورا من OpenAI على محاكاة الفيزياء بدقة داخل مقاطع الفيديو هي ميزة جديدة هي نتيجة التدريب من ملايين مقاطع الفيديو التي تحتوي على حركات تعتمد على الفيزياء الحقيقية. يتمتع سورا بثبات ممتاز في الموضوع. حتى لو غادر الهدف الإطار أو تمت مقاطعته بشيء آخر في الإطار، فإنه سيبقى هناك ويعود دون أي تدخل.

ومع ذلك، لا يزال من الممكن ظهور المشكلات عندما تتفاعل الكائنات الموجودة في الفيديو مع العلاقات السببية والإنشاء التلقائي للكائنات. أيضًا، ومن المضحك إلى حد ما، أن سورا من OpenAI يخلط أحيانًا بين اليسار واليمين. ومع ذلك، فإن ما تم إثباته حتى الآن ليس عمليًا فحسب، بل هو بالتأكيد تكنولوجيا متطورة.

متى يتوفر سورا للعامة؟

لذا، نحن جميعًا متحمسون جدًا لاختبار سورا. حتى اليوم، ليس من الواضح كم من الوقت سيستغرق الأمر حتى يصبح سورا متاحًا لعامة الناس أو كم سيكلف الوصول إلى سورا.

حيث ذكرت OpenAI أن النموذج في أيدي “الفريق الأحمر”. هذا الفريق عبارة عن مجموعة من الأشخاص المكلفين بجعل سورا يفعل كل أنواع الأشياء الشريرة التي لا ينبغي له القيام بها، والمساعدة في وضع حواجز حماية ضد مثل هذه الأفعال. يحدث هذا عندما يكون متاحًا للعملاء الحقيقيين. يتضمن ذلك إنشاء معلومات مضللة وإنشاء مواد مسيئة أو مسيئة والعديد من الانتهاكات المحتملة الأخرى.

حتى وقت كتابة هذه السطور، كان هذا في أيدي منشئي المحتوى المختارين. ولكن هذا لأغراض الاختبار ومخصص لمراجعة الطرف الثالث والموافقة عليه في الطريق إلى الإصدار النهائي. يبدو أنه كذلك.

خلاصة القول هي، تمامًا مثل الدفع مقابل استخدام DALL-E 3، فأنت لا تعرف متى سيكون متاحًا بالفعل. في الواقع، حتى OpenAI لا يعرف التاريخ الدقيق بعد. هذا ببساطة لأنه إذا وصل إلى أيدي مختبري الأمان، فقد يكتشفون مشكلات يستغرق إصلاحها وقتًا أطول من المتوقع، مما يؤدي إلى تأخير النشر.

اتضح أن OpenAI تشعر بأنها مستعدة للتباهي بسورا وحتى تقديم نوع من البيان العام المنسق من خلال السلامة، ولكن لا يمكن لأحد أن يقول ذلك على وجه اليقين. أعتقد أننا نتحدث عن أشهر، وليس سنوات، لكن لا تتوقع ذلك الأسبوع المقبل. تحقق الآن من أفضل 5 تطبيقات تنافس تطبيق ChatGPT من OpenAI على الآيفون والأندرويد

 

بوشريط صلاح الدين

مصمم ومبرمج وكاتب مقالات محترف

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى
error: Content is protected !!