När världen av artificiell intelligens (AI) fortsätter att utvecklas i en exponentiell takt har ElevenLabs, en startup från San Francisco, gjort en banbrytande tillkännagivande. De har utvecklat en ny AI-modell som kan generera tal med din röst på 30 språk, en betydande ökning från de ursprungliga åtta. Denna framsteg är redo att revolutionera områdena röstkloning och flerspråkig kommunikation.
Det flerspråkiga steget
ElevenLabs har använt Lukeman Literary, ett litterärt förlag och en oberoende utgivare, som en fallstudie för att visa effektiviteten hos deras teknologi. Lukeman producerar många flerspråkiga ljudböcker årligen, en process som tidigare tog veckor på grund av behovet av att hitta rätt voiceover-artist, boka en inspelningsstudio och hantera efterproduktionen. Nu, tack vare ElevenLabs’ AI-modell, kan hela processen slutföras på några timmar.
Den nya modellen Multilingual v2 kan leverera ljud som är rikt på känslor och fångar de subtila nyanserna i naturligt tal. Användare kan skriva in den text de vill att röst ska genereras på målspråket, och AI:n kommer att generera en sömlös voiceover.
Röstkloningsalternativ
ElevenLabs erbjuder två primära verktyg för röstkloning: ett text-till-tal-verktyg och en ”VoiceLab” för att klona specifika röster. Användare kan ladda upp talprover för att skapa en anpassad röstklon, som AI:n analyserar för att konstruera en syntetisk version. Denna klonade röst kan sedan manipuleras för att säga vad som helst. Den senaste uppdateringen gör att dessa AI-kloner kan flytande tala språk som svenska, arabiska och malajiska.
Adressering av etiska frågor
Trots de potentiella fördelarna finns det oro för missbruk av denna teknologi. Deepfake-ljud kan göra användare mottagliga för bedrägerier och desinformationskampanjer. ElevenLabs mötte kritik förra året när deras plattform användes för att imitera och trakassera offentliga personer. Företaget har sedan dess infört strängare skyddsåtgärder, men etiska frågor kvarstår.
Stora teknikföretag som Meta har mött liknande kritik för att utveckla kraftfulla generativa AI utan full transparens. Meta presenterade nyligen ett AI-talssyntesverktyg som kallas Voicebox, vilket de erkände lätt kunde underlätta deepfakes. Dock avstod Meta från någon offentlig lansering på grund av ”risken för missbruk”.
Trots dessa farhågor verkar den snabba utvecklingen inom AI-röstkloning vara ostopplig. Som lingvisten Mati Staniszewski från ElevenLabs sa: ”Vi hoppas till slut att täcka ännu fler språk och röster med hjälp av AI och eliminera de språkliga hindren för innehåll.”
Utmaningen ligger i att säkerställa en etisk implementering. Gränsen mellan global desinformation och innovativa sätt att kommunicera är mycket tunn, och att vara försiktig är nyckeln.
I den ständigt föränderliga världen av kryptovalutor och AI spelar plattformar som cryptoview.io en avgörande roll genom att tillhandahålla aktuell och relevant information. Håll dig uppdaterad med krypto-nyheter och uppdateringar på cryptoview.io.
Upptäck mer på Cryptoview.io
