सामाजिक मीडिया विशालकाय मेटा ने हाल ही में अपने नवाचारी वीडियो जनरेशन के लिए AI मॉडल्स और इमेज संपादन का पर्दाफाश किया है। ये आधुनिक मॉडल्स अभी प्रायोगिक चरण में हैं, लेकिन प्रारंभिक परिणाम सुझाव देते हैं कि ये सामग्री निर्माताओं, कलाकारों और एनीमेटर्स के लिए गेम चेंजर्स हो सकते हैं।
इमू वीडियो और इमू संपादन की शक्ति का पर्दाफाश
मेटा द्वारा पेश किए गए दो AI मॉडल्स इमू वीडियो और इमू संपादन हैं। इमू वीडियो, मेटा के पिछले इमू मॉडल का विस्तार है, जो पाठ और छवि इनपुट से वीडियो क्लिप्स उत्पन्न कर सकता है। दूसरी ओर, इमू संपादन छवि संपादन में सुधारित सटीकता प्रदान करता है।
इमू वीडियो एक अद्वितीय “फैक्टराइज्ड” दृष्टिकोण का उपयोग करता है, प्रशिक्षण प्रक्रिया को दो चरणों में विभाजित करके मॉडल को विभिन्न इनपुट के प्रति संवेदी बनाने के लिए। यह पहले पाठ प्रम्प्ट के आधार पर छवियां उत्पन्न करता है, फिर उस पाठ और उत्पन्न छवि का उपयोग करके वीडियो बनाता है। यह मॉडल पाठ प्रम्प्ट के आधार पर छवियों को भी “एनीमेट” कर सकता है।
अन्य मॉडलों की विपरीत जो गहरे पारंगतता के लिए निर्भर होते हैं, इमू वीडियो केवल दो विकीर्णन मॉडल्स का उपयोग करता है ताकि 16 फ्रेम प्रति सेकंड पर 512×512 चार-सेकंड वीडियो उत्पन्न किया जा सके। दूसरी ओर, इमू संपादन उपयोगकर्ताओं को छवि पृष्ठभूमि जोड़ने या हटाने, रंग और ज्यामिति परिवर्तन करने, और स्थानीय और वैश्विक दोनों छवियों का संपादन करने की सुविधा प्रदान करता है।
मेटा का सटीकता और संवेदीता के प्रति प्रतिबद्धता
मेटा जोर देता है कि इन मॉडल्स का प्राथमिक लक्ष्य सिर्फ “विश्वसनीय” छवियां उत्पन्न करना नहीं है। बल्कि, ध्यान केवल संपादन अनुरोध के संबंधित पिक्सेल्स को ही बदलने पर है। उदाहरण के लिए, अगर निर्देशन है कि बेसबॉल कैप पर “आलोहा!” टेक्स्ट जोड़ना है, तो मॉडल सुनिश्चित करता है कि कैप खुद में बिना बदलाव रहे।
इमू संपादन को कंप्यूटर विजन कार्यों का उपयोग करके 10 मिलियन संशोधित छवियों के डेटासेट के साथ प्रशिक्षित किया गया था, प्रत्येक में एक इनपुट छवि, एक कार्य विवरण और एक लक्षित आउटपुट छवि। मेटा दावा करता है कि यह आज तक का सबसे बड़ा इस प्रकार का डेटासेट है।
विशाल डेटासेट के साथ AI मॉडल्स का प्रशिक्षण
मूल इमू मॉडल को एक भयानक 11 अरब डेटा तुकड़ों का प्रशिक्षण दिया गया था, जिसमें फेसबुक और इंस्टाग्राम पर उपयोगकर्ताओं द्वारा साझा की गई फोटो और कैप्शन शामिल थे। इसे सितंबर में मेटा कनेक्ट इवेंट में सीईओ मार्क ज़करबर ने खुलासा किया।
इन AI उपकरणों की संभावनाओं के बावजूद, निगरानीकर्ताओं की निकट निगरानी के कारण, मेटा ने इनकी विस्तार में सतर्क रहा है। उदाहरण के लिए, हाल ही में मेटा ने घोषणा की है कि वह राजनीतिक अभियानों और विज्ञापनकर्ताओं को फेसबुक और इंस्टाग्राम पर विज्ञापन बनाने के लिए अपने AI उपकरणों का उपयोग नहीं करने देगा।
जब हम AI और इसके अनुप्रयोगों की दुनिया में गहराई से जाते हैं, तो जैसे कि cryptoview.io जैसे प्लेटफ़ॉर्म स्वरूपी विशेषताओं के साथ तेजी से बदलते तकनीकी परिदृश्य में मूल्यवान अनुभव प्रदान कर सकते हैं। इसकी व्यापक सुविधाओं के साथ, cryptoview.io उपयोगकर्ताओं को तकनीकी दुनिया में होने वाली नवीनतम विकासों के साथ अद्यतित रहने में मदद कर सकता है।
