كيف تقوم نماذج الذكاء الاصطناعي بثورة إنشاء الفيديو وتحرير الصور؟

كيف تقوم نماذج الذكاء الاصطناعي بثورة إنشاء الفيديو وتحرير الصور؟

CryptoView.io APP

أشعة الأسواق المشفرة

ميتا، عملاق التواصل الاجتماعي، كشف مؤخرًا عن نماذجه الابتكارية لإنشاء الفيديو وتحرير الصور. تزال هذه النماذج متقدمة في مرحلتها التجريبية، لكن النتائج الأولية تشير إلى أنها قد تكون محدثة لمنشئي المحتوى والفنانين والمحركين.

الكشف عن قوة فيديو الإيمو وتحرير الإيمو

النماذج الذكاء الاصطناعي الاثنان المقدمان من ميتا هما فيديو الإيمو وتحرير الإيمو. يستطيع فيديو الإيمو، وهو تحسين لنموذج إيمو السابق لدى ميتا، توليد مقاطع الفيديو من المدخلات النصية والصور. من ناحية أخرى، يركز تحرير الإيمو على تلاعب الصور، مما يوفر دقة محسنة في تحرير الصور.

يستخدم فيديو الإيمو نهجًا “معاملة” فريدًا، يقسم عملية التدريب إلى خطوتين لجعل النموذج مستجيبًا للمدخلات المختلفة. يولد النموذج أولاً الصور استنادًا إلى ملصق نصي، ثم ينشئ فيديو باستخدام كل من النص والصورة المولدة. يمكن لهذا النموذج أيضًا “تحريك” الصور استنادًا إلى ملصق نصي.

على عكس النماذج الأخرى التي تعتمد على تتابع عميق من النماذج، يستخدم فيديو الإيمو نموذجي انتشار فقط لتوليد مقاطع فيديو بدقة 512×512 لمدة أربع ثوانٍ بمعدل 16 إطارًا في الثانية. تمكّن تحرير الإيمو، من ناحية أخرى، المستخدمين من إضافة أو إزالة خلفيات الصورة، وإجراء تحويلات اللون والهندسة، وتحرير الصور محليًا وعالميًا.

التزام ميتا بالدقة والاستجابة

تؤكد ميتا أن الهدف الرئيسي من هذه النماذج ليس فقط إنتاج صور “معقولة”. بدلاً من ذلك، يتم التركيز على تغيير البكسلات ذات الصلة بطلب التحرير بأقصى دقة. على سبيل المثال، إذا كان التعليم هو إضافة النص “ألوها!” إلى قبعة بيسبول، يضمن النموذج أن القبعة نفسها تظل دون تغيير.

تم تدريب تحرير الإيمو باستخدام مهام رؤية الحاسوب مع مجموعة بيانات تضم 10 ملايين صورة مركبة، كل صورة بها صورة مدخل، وصف للمهمة، وصورة مستهدفة للناتج. تدّعي ميتا أن هذه هي أكبر مجموعة بيانات من نوعها حتى الآن.

تدريب نماذج الذكاء الاصطناعي باستخدام مجموعات بيانات ضخمة

تم تدريب النموذج الأصلي إيمو باستخدام 1.1 مليار قطعة من البيانات، بما في ذلك الصور والتسميات المشاركة من قبل المستخدمين على فيسبوك وإنستغرام. كشف عن ذلك الرئيس التنفيذي مارك زوكربيرج في حدث Meta Connect في سبتمبر.

على الرغم من إمكانات هذه الأدوات الذكاء الاصطناعي، كانت ميتا حذرة في نشرها بسبب المراقبة الدقيقة من قبل الجهات التنظيمية. على سبيل المثال، أعلنت ميتا مؤخرًا أنها لن تسمح للحملات السياسية والمعلنين باستخدام أدواتها الذكاء الاصطناعي لإنشاء إعلانات على فيسبوك وإنستغرام.

بينما نغوص عميقًا في عالم الذكاء الاصطناعي وتطبيقاته، يمكن لمنصات مثل cryptoview.io تقديم رؤى قيمة في المشهد التكنولوجي المتطور بسرعة. من خلال ميزاتها الشاملة، يمكن لـ cryptoview.io مساعدة المستخدمين في البقاء على اطلاع بآخر التطورات في عالم التكنولوجيا.

استكشف cryptoview.io الآن

تحكم في مؤشرات RSI لجميع أسواق العملات المشفرة

RSI Weather

كل مؤشرات RSI لأكبر الحجوم في لمح البصر.
استخدم أداتنا لرؤية مشاعر السوق فورًا أو فقط لمفضلاتك.