Som verden av kunstig intelligens (AI) fortsetter å utvikle seg i eksponentiell fart, har ElevenLabs, et oppstartsselskap basert i San Francisco, gjort en banebrytende kunngjøring. De har utviklet en ny AI-modell som kan generere tale med din stemme på 30 språk, et betydelig sprang fra de opprinnelige åtte. Denne fremgangen er klar til å revolusjonere områdene for talekloning og flerspråklig kommunikasjon.
Det flerspråklige spranget
ElevenLabs har brukt Lukeman Literary, et litterært byrå og uavhengig forlag, som en case-studie for å demonstrere effektiviteten til teknologien deres. Lukeman produserer mange flerspråklige lydbøker årlig, en prosess som pleide å ta uker på grunn av behovet for å finne riktig voiceover-artist, bestille et lydstudio og håndtere etterproduksjonen. Nå kan hele prosessen takket være ElevenLabs’ AI-modell fullføres på bare noen få timer.
Den nye flerspråklige v2-modellen kan levere lyd som er rik på følelser og fanger opp de subtile nyansene i naturlig tale. Brukere kan skrive inn teksten de ønsker uttalt på målspråket, og AI vil generere en sømløs voiceover.
Valgmuligheter for talekloning
ElevenLabs tilbyr to primære verktøy for talekloning: et tekst-til-tale-verktøy og en “VoiceLab” for kloning av spesifikke stemmer. Brukere kan laste opp taleprøver for å opprette en tilpasset stemmeklon, som AI analyserer for å konstruere en syntetisk versjon. Denne klonede stemmen kan deretter manipuleres til å si hva som helst. Den siste oppdateringen gjør det mulig for disse AI-klonene å snakke flytende språk som svensk, arabisk og malayisk.
Å takle etiske bekymringer
Til tross for de potensielle fordelene, er det bekymringer knyttet til misbruk av denne teknologien. Deepfake-lyd kan gjøre brukere sårbare for svindel og desinformasjonskampanjer. ElevenLabs opplevde motstand i fjor da plattformen deres ble brukt til å etterligne og trakassere offentlige personer. Selskapet har siden implementert strengere sikkerhetstiltak, men etiske bekymringer forblir.
Store teknologiselskaper som Meta har møtt lignende kritikk for å utvikle kraftig generativ AI uten full åpenhet. Meta avduket nylig et AI-talegenereringsverktøy kalt Voicebox, som de innrømmet kunne lett muliggjøre deepfakes. Imidlertid avstod Meta fra noen offentlig utgivelse på grunn av “risikoen for misbruk”.
Til tross for disse bekymringene ser det ut til at den raske fremgangen innen AI-talekloning er ustoppelig. Som lingvist Mati Staniszewski fra ElevenLabs uttalte: “På sikt håper vi å dekke enda flere språk og stemmer med hjelp av AI, og eliminere de språklige barrierene for innhold.”
Utfordringen ligger i å sikre en etisk implementering. Grensen mellom global desinformasjon og innovative måter å kommunisere på er veldig tynn, og det er viktig å være forsiktig.
I den stadig skiftende verdenen av kryptovalutaer og AI spiller plattformer som cryptoview.io en essensiell rolle i å tilby oppdatert og relevant informasjon. Hold deg oppdatert på krypto-nyheter og oppdateringer med cryptoview.io.
Oppdag Mer på Cryptoview.io
