Hvordan revolusjonerer AI-modeller videoproduksjon og bildebehandling?

Hvordan revolusjonerer AI-modeller videoproduksjon og bildebehandling?

CryptoView.io APP

Røntgen av krypto-markeder

Meta, det sosiale mediegiganten, har nylig avduket sine innovative AI-modeller for videoproduksjon og bildebehandling. Disse toppmoderne modellene er fortsatt i eksperimentfasen, men tidlige resultater antyder at de kan være spillvekslere for innholdsprodusenter, kunstnere og animatører.

Avduking av kraften til Emu Video og Emu Edit

De to AI-modellene introdusert av Meta er Emu Video og Emu Edit. Emu Video, en forbedring av Metas tidligere Emu-modell, kan generere videoklipp fra tekst- og bildeinndata. På den annen side fokuserer Emu Edit på bildebehandling og tilbyr forbedret presisjon i bildebehandling.

Emu Video bruker en unik “faktorisert” tilnærming, som deler treningsprosessen inn i to trinn for å gjøre modellen responsiv til ulike inndata. Den genererer først bilder basert på en tekstforespørsel, og deretter skaper den en video ved å bruke både teksten og det genererte bildet. Denne modellen kan også “animere” bilder basert på en tekstforespørsel.

I motsetning til andre modeller som er avhengige av en dyp kaskade av modeller, bruker Emu Video bare to diffusjonsmodeller for å generere 512×512 firesekunders videoer med 16 bilder per sekund. Emu Edit muliggjør derimot at brukere legger til eller fjerner bildebakgrunner, utfører farge- og geometriendringer, og redigerer bilder både lokalt og globalt.

Metas forpliktelse til presisjon og respons

Meta understreker at hovedmålet med disse modellene ikke bare er å produsere “troverdige” bilder. Fokuset er i stedet på å endre bare pikslene som er relevante for redigeringsforespørselen med størst mulig presisjon. For eksempel, hvis instruksjonen er å legge til teksten “Aloha!” på en baseballcap, sørger modellen for at capsen selv forblir uendret.

Emu Edit ble trent ved hjelp av datavisjonoppgaver med et datasett på 10 millioner syntetiserte bilder, hver med et inngangsbilde, en oppgavebeskrivelse og et målrettet utgangsbilde. Meta hevder at dette er det største datasettet av denne typen til dags dato.

Trening av AI-modeller med massive datasett

Den opprinnelige Emu-modellen ble trent ved hjelp av et imponerende 1,1 milliarder datadeler, inkludert bilder og bildetekster delt av brukere på Facebook og Instagram. Dette ble avslørt av administrerende direktør Mark Zuckerberg under Meta Connect-arrangementet i september.

Tross potensialet til disse AI-verktøyene har Meta vært forsiktig med implementeringen på grunn av nøye granskning fra regulatorer. For eksempel kunngjorde Meta nylig at de ikke vil tillate politiske kampanjer og annonsører å bruke sine AI-verktøy til å lage annonser på Facebook og Instagram.

Som vi fordype oss i verdenen av AI og dens applikasjoner, kan plattformer som cryptoview.io gi uvurderlige innsikter i det raskt utviklende teknologilandskapet. Med sine omfattende funksjoner kan cryptoview.io hjelpe brukere med å holde seg oppdatert med de nyeste utviklingene i tech-verdenen.

Utforsk cryptoview.io nå

Kontroller RSI for alle krypto markeder

RSI Weather

Alle RSI for de største volumene med ett blikk.
Bruk vårt verktøy for å umiddelbart visualisere markedssentimentet eller bare dine favoritter.