Terwijl de wereld van kunstmatige intelligentie (AI) zich in een razendsnel tempo blijft ontwikkelen, heeft ElevenLabs, een startup uit San Francisco, een baanbrekende aankondiging gedaan. Ze hebben een nieuw AI-model ontwikkeld dat spraak kan genereren met behulp van je eigen stem in 30 talen, een grote sprong voorwaarts ten opzichte van de oorspronkelijke acht. Deze vooruitgang staat op het punt de wereld van spraakkloons en meertalige communicatie te revolutioneren.
De sprong naar meertaligheid
ElevenLabs heeft Lukeman Literary, een literair agentschap en onafhankelijke uitgeverij, gebruikt als casestudy om de effectiviteit van hun technologie aan te tonen. Lukeman produceert jaarlijks talloze meertalige luisterboeken, een proces dat voorheen weken in beslag nam vanwege de noodzaak om de juiste voice-over artiest te vinden, een opnamestudio te boeken en de post-productie te beheren. Dankzij het AI-model van ElevenLabs kan het hele proces nu binnen enkele uren worden voltooid.
Het nieuwe Multilingual v2-model kan audio leveren die rijk is aan emotie en de subtiele intonaties van natuurlijke spraak vastlegt. Gebruikers kunnen de tekst typen die ze willen laten spreken in de doeltaal, waarna de AI een naadloze voice-over genereert.
Spraakkloningsmogelijkheden
ElevenLabs biedt twee belangrijke spraakkloningstools: een tekst-naar-spraak tool en een “VoiceLab” voor het klonen van specifieke stemmen. Gebruikers kunnen spraakvoorbeelden uploaden om een op maat gemaakte stemklonen te maken, die door de AI worden geanalyseerd om een synthetische versie te construeren. Deze gekloonde stem kan vervolgens worden gemanipuleerd om alles te zeggen wat je maar kunt bedenken. De nieuwste update maakt het mogelijk dat deze AI-klonen vloeiend talen zoals Zweeds, Arabisch en Maleis kunnen spreken.
Omgaan met ethische zorgen
Ondanks de mogelijke voordelen zijn er zorgen over het misbruik van deze technologie. Deepfake-audio kan gebruikers kwetsbaar maken voor fraude en misinformatiecampagnes. ElevenLabs kreeg vorig jaar te maken met kritiek toen het platform werd gebruikt om bekende personen na te bootsen en lastig te vallen. Het bedrijf heeft sindsdien strengere beveiligingsmaatregelen genomen, maar ethische zorgen blijven bestaan.
Grote technologiebedrijven zoals Meta hebben soortgelijke kritiek gekregen omdat ze krachtige generatieve AI hebben ontwikkeld zonder volledige transparantie. Meta heeft onlangs een AI-spraaksynthesetool genaamd Voicebox onthuld, waarvan het erkende dat het gemakkelijk deepfakes kan faciliteren. Meta heeft echter afgezien van een openbare release vanwege de “risico’s van misbruik”.
Ondanks deze zorgen lijkt de snelle vooruitgang in AI-spraakkloning onstuitbaar. Zoals taalkundige Mati Staniszewski van ElevenLabs zei: “Uiteindelijk hopen we met behulp van AI nog meer talen en stemmen te kunnen bedienen en zo de taalbarrières voor inhoud te kunnen overwinnen.”
De uitdaging ligt in een ethische implementatie. De scheidslijn tussen wereldwijde desinformatie en innovatieve manieren van communicatie is zeer dun en voorzichtigheid is geboden.
In de voortdurend veranderende wereld van cryptocurrencies en AI spelen platforms zoals cryptoview.io een essentiële rol bij het verstrekken van actuele en relevante informatie. Blijf op de hoogte van crypto-nieuws en updates met cryptoview.io.
Ontdek meer op Cryptoview.io
