Som kunstig intelligens (AI) fortsætter med at udvikle sig i eksponentiel hastighed, har ElevenLabs, en startup fra San Francisco, gjort en banebrydende meddelelse. De har udviklet en ny AI-model, der kan generere tale ved hjælp af din stemme på 30 sprog, hvilket er et betydeligt fremskridt fra de oprindelige otte. Denne udvikling er klar til at revolutionere områderne for stemmekloning og flersproget kommunikation.
Det flersprogede spring
ElevenLabs har brugt Lukeman Literary, et litterært agentur og en uafhængig forlægger, som et case study for at demonstrere effektiviteten af deres teknologi. Lukeman producerer adskillige flersprogede lydbøger årligt, en proces der plejede at tage uger på grund af behovet for at finde den rette voiceover-kunstner, booke et lydstudie og håndtere efterproduktionen. Nu kan hele processen takket være ElevenLabs’ AI-model gennemføres på få timer.
Den nye Multilingual v2-model kan levere lyd, der er rig på følelser og fanger de subtile nuancer i naturlig tale. Brugere kan skrive den tekst, de vil have talt på målsproget, og AI’en vil generere en problemfri voiceover.
Stemmekloningsoptioner
ElevenLabs tilbyder to primære værktøjer til stemmekloning: et tekst-til-tale-værktøj og en “VoiceLab” til kloning af specifikke stemmer. Brugere kan uploade taleprøver for at skabe en brugerdefineret stemmeklon, som AI’en analyserer for at konstruere en syntetisk version. Denne klonede stemme kan derefter manipuleres til at sige alt muligt. Den seneste opdatering gør det muligt for disse AI-kloner at tale flydende sprog som svensk, arabisk og malayisk.
Etiske bekymringer
Trods de potentielle fordele er der bekymringer om misbrug af denne teknologi. Deepfake-lyd kan gøre brugere sårbare over for svindel og misinformation. ElevenLabs oplevede modstand sidste år, da deres platform blev brugt til at efterligne og chikanere offentlige personer. Siden da har virksomheden indført strengere sikkerhedsforanstaltninger, men etiske bekymringer er stadig til stede.
Store teknologifirmaer som Meta har mødt lignende kritik for at udvikle kraftfuld generativ AI uden fuld gennemsigtighed. Meta har for nylig præsenteret et AI-tale-synteseværktøj kaldet Voicebox, som de anerkendte kunne let lette deepfakes. Dog afstod Meta fra enhver offentlig udgivelse på grund af “risikoen for misbrug”.
Trods disse bekymringer ser det ud til, at den hurtige udvikling inden for AI-stemmekloning er ustoppelig. Som sprogforsker Mati Staniszewski fra ElevenLabs udtalte: “På et tidspunkt håber vi at dække endnu flere sprog og stemmer med hjælp fra AI og fjerne de sproglige barrierer for indhold.”
Udfordringen ligger i at sikre en etisk implementering. Grænsen mellem global misinformation og innovative måder at kommunikere på er meget tynd, og det er vigtigt at gå forsigtigt frem.
I den evigt udviklende verden af kryptovalutaer og AI spiller platforme som cryptoview.io en afgørende rolle i at levere opdateret og relevant information. Hold dig opdateret med krypto-nyheder og opdateringer på cryptoview.io.
Opdag mere på Cryptoview.io
