Hur revolutionerar AI-modeller videogenomsläpp och bildredigering?

Hur revolutionerar AI-modeller videogenomsläpp och bildredigering?

CryptoView.io APP

Röntgen av kryptomarknader

Meta, den sociala mediejätten, har nyligen avslöjat sina innovativa AI-modeller för videogenomsläpp och bildredigering. Dessa toppmoderna modeller är fortfarande i experimentstadiet, men tidiga resultat tyder på att de kan vara spelväxlare för innehållsskapare, konstnärer och animatörer.

Avslöjande av kraften i Emu Video och Emu Edit

De två AI-modeller som introducerats av Meta är Emu Video och Emu Edit. Emu Video, en förbättring av Metas tidigare Emu-modell, kan generera videoklipp från text- och bildinmatningar. Å andra sidan fokuserar Emu Edit på bildmanipulation och erbjuder förbättrad precision i bildredigering.

Emu Video använder en unik ”faktorisering”-metod, som delar in träningsprocessen i två steg för att göra modellen responsiv för olika inmatningar. Den genererar först bilder baserat på en textprompt och skapar sedan en video med både texten och den genererade bilden. Denna modell kan även ”animera” bilder baserat på en textprompt.

Till skillnad från andra modeller som förlitar sig på en djup kaskad av modeller, använder Emu Video endast två diffusionsmodeller för att generera 512×512 fyra sekunders långa videor med 16 bilder per sekund. Emu Edit möjliggör å andra sidan för användare att lägga till eller ta bort bildbakgrunder, utföra färg- och geometriomvandlingar samt redigera bilder både lokalt och globalt.

Metas engagemang för precision och respons

Meta betonar att huvudmålet med dessa modeller inte bara är att producera ”trovärdiga” bilder. Istället ligger fokus på att endast ändra pixlarna som är relevanta för redigeringsbegäran med största precision. Till exempel, om instruktionen är att lägga till texten ”Aloha!” på en basebollkeps, ser modellen till att kepsen själv förblir oförändrad.

Emu Edit tränades med datorseendesuppgifter med en datamängd på 10 miljoner syntetiserade bilder, var och en med en inmatningsbild, en uppgiftsbeskrivning och en målinriktad utmatningsbild. Meta hävdar att detta är den hittills största datamängden av sitt slag.

Träning av AI-modeller med massiva datamängder

Den ursprungliga Emu-modellen tränades med en häpnadsväckande mängd på 1,1 miljarder dataenheter, inklusive foton och bildtexter som delats av användare på Facebook och Instagram. Detta avslöjades av VD Mark Zuckerberg vid Meta Connect-evenemanget i september.

Trots potentialen hos dessa AI-verktyg har Meta varit försiktiga med deras implementering på grund av nära granskning från regleringsorgan. Till exempel meddelade Meta nyligen att man inte kommer att tillåta politiska kampanjer och annonsörer att använda sina AI-verktyg för att skapa annonser på Facebook och Instagram.

När vi fördjupar oss i AI-världen och dess tillämpningar kan plattformar som cryptoview.io erbjuda ovärderliga insikter i den snabbt föränderliga tekniklandskapet. Med sina omfattande funktioner kan cryptoview.io hjälpa användare att hålla sig uppdaterade med de senaste utvecklingarna inom teknikvärlden.

Utforska cryptoview.io nu

Kontrollera RSI för alla krypto marknader

RSI Weather

Alla RSI för de största volymerna vid en blick.
Använd vårt verktyg för att omedelbart visualisera marknadskänslan eller bara dina favoriter.