कैसे AI मॉडल वीडियो जनरेशन और इमेज संपादन को क्रांति ला रहे हैं?

कैसे AI मॉडल वीडियो जनरेशन और इमेज संपादन को क्रांति ला रहे हैं?

CryptoView.io APP

क्रिप्टो बाजारों की एक्स-रे

सामाजिक मीडिया विशालकाय मेटा ने हाल ही में अपने नवाचारी वीडियो जनरेशन के लिए AI मॉडल्स और इमेज संपादन का पर्दाफाश किया है। ये आधुनिक मॉडल्स अभी प्रायोगिक चरण में हैं, लेकिन प्रारंभिक परिणाम सुझाव देते हैं कि ये सामग्री निर्माताओं, कलाकारों और एनीमेटर्स के लिए गेम चेंजर्स हो सकते हैं।

इमू वीडियो और इमू संपादन की शक्ति का पर्दाफाश

मेटा द्वारा पेश किए गए दो AI मॉडल्स इमू वीडियो और इमू संपादन हैं। इमू वीडियो, मेटा के पिछले इमू मॉडल का विस्तार है, जो पाठ और छवि इनपुट से वीडियो क्लिप्स उत्पन्न कर सकता है। दूसरी ओर, इमू संपादन छवि संपादन में सुधारित सटीकता प्रदान करता है।

इमू वीडियो एक अद्वितीय “फैक्टराइज्ड” दृष्टिकोण का उपयोग करता है, प्रशिक्षण प्रक्रिया को दो चरणों में विभाजित करके मॉडल को विभिन्न इनपुट के प्रति संवेदी बनाने के लिए। यह पहले पाठ प्रम्प्ट के आधार पर छवियां उत्पन्न करता है, फिर उस पाठ और उत्पन्न छवि का उपयोग करके वीडियो बनाता है। यह मॉडल पाठ प्रम्प्ट के आधार पर छवियों को भी “एनीमेट” कर सकता है।

अन्य मॉडलों की विपरीत जो गहरे पारंगतता के लिए निर्भर होते हैं, इमू वीडियो केवल दो विकीर्णन मॉडल्स का उपयोग करता है ताकि 16 फ्रेम प्रति सेकंड पर 512×512 चार-सेकंड वीडियो उत्पन्न किया जा सके। दूसरी ओर, इमू संपादन उपयोगकर्ताओं को छवि पृष्ठभूमि जोड़ने या हटाने, रंग और ज्यामिति परिवर्तन करने, और स्थानीय और वैश्विक दोनों छवियों का संपादन करने की सुविधा प्रदान करता है।

मेटा का सटीकता और संवेदीता के प्रति प्रतिबद्धता

मेटा जोर देता है कि इन मॉडल्स का प्राथमिक लक्ष्य सिर्फ “विश्वसनीय” छवियां उत्पन्न करना नहीं है। बल्कि, ध्यान केवल संपादन अनुरोध के संबंधित पिक्सेल्स को ही बदलने पर है। उदाहरण के लिए, अगर निर्देशन है कि बेसबॉल कैप पर “आलोहा!” टेक्स्ट जोड़ना है, तो मॉडल सुनिश्चित करता है कि कैप खुद में बिना बदलाव रहे।

इमू संपादन को कंप्यूटर विजन कार्यों का उपयोग करके 10 मिलियन संशोधित छवियों के डेटासेट के साथ प्रशिक्षित किया गया था, प्रत्येक में एक इनपुट छवि, एक कार्य विवरण और एक लक्षित आउटपुट छवि। मेटा दावा करता है कि यह आज तक का सबसे बड़ा इस प्रकार का डेटासेट है।

विशाल डेटासेट के साथ AI मॉडल्स का प्रशिक्षण

मूल इमू मॉडल को एक भयानक 11 अरब डेटा तुकड़ों का प्रशिक्षण दिया गया था, जिसमें फेसबुक और इंस्टाग्राम पर उपयोगकर्ताओं द्वारा साझा की गई फोटो और कैप्शन शामिल थे। इसे सितंबर में मेटा कनेक्ट इवेंट में सीईओ मार्क ज़करबर ने खुलासा किया।

इन AI उपकरणों की संभावनाओं के बावजूद, निगरानीकर्ताओं की निकट निगरानी के कारण, मेटा ने इनकी विस्तार में सतर्क रहा है। उदाहरण के लिए, हाल ही में मेटा ने घोषणा की है कि वह राजनीतिक अभियानों और विज्ञापनकर्ताओं को फेसबुक और इंस्टाग्राम पर विज्ञापन बनाने के लिए अपने AI उपकरणों का उपयोग नहीं करने देगा।

जब हम AI और इसके अनुप्रयोगों की दुनिया में गहराई से जाते हैं, तो जैसे कि cryptoview.io जैसे प्लेटफ़ॉर्म स्वरूपी विशेषताओं के साथ तेजी से बदलते तकनीकी परिदृश्य में मूल्यवान अनुभव प्रदान कर सकते हैं। इसकी व्यापक सुविधाओं के साथ, cryptoview.io उपयोगकर्ताओं को तकनीकी दुनिया में होने वाली नवीनतम विकासों के साथ अद्यतित रहने में मदद कर सकता है।

cryptoview.io अब अन्वेषण करें

सभी क्रिप्टो बाजारों के RSI को नियंत्रित करें

RSI Weather

सभी बड़े वॉल्यूम के RSI एक नजर में।
बाजार की भावना को तुरंत देखने के लिए हमारे उपकरण का उपयोग करें या केवल अपने पसंदीदा के लिए।