Pouvez-vous désormais générer de la parole en 30 langues grâce à l'IA ?

Pouvez-vous désormais générer de la parole en 30 langues grâce à l’IA ?

CryptoView.io APP

Scannez tous les marchés crypto

Alors que le monde de l’intelligence artificielle (IA) continue d’évoluer à un rythme exponentiel, une start-up basée à San Francisco, ElevenLabs, a fait une annonce révolutionnaire. Ils ont développé un nouveau modèle d’IA qui peut générer de la parole en utilisant votre voix dans 30 langues, ce qui représente un bond significatif par rapport aux huit langues originales. Cette avancée est sur le point de révolutionner les domaines du clonage vocal et de la communication multilingue.

Le saut multilingue

ElevenLabs a utilisé Lukeman Literary, une agence littéraire et maison d’édition indépendante, comme étude de cas pour démontrer l’efficacité de leur technologie. Lukeman produit de nombreux livres audio multilingues chaque année, un processus qui prenait autrefois des semaines en raison de la nécessité de trouver le bon comédien de doublage, de réserver un studio d’enregistrement et de gérer la post-production. Maintenant, grâce au modèle d’IA d’ElevenLabs, l’ensemble du processus peut être terminé en quelques heures seulement.

Le nouveau modèle Multilingue v2 peut fournir un audio riche en émotion et capturer les inflexions subtiles de la parole naturelle. Les utilisateurs peuvent taper le texte qu’ils veulent entendre dans la langue cible, et l’IA générera une voix off parfaitement fluide.

Options de clonage vocal

ElevenLabs propose deux outils principaux de clonage vocal : un outil de synthèse vocale et un « VoiceLab » pour cloner des voix spécifiques. Les utilisateurs peuvent télécharger des échantillons de discours pour créer un clone vocal personnalisé, que l’IA analyse pour construire une version synthétique. Cette voix clonée peut ensuite être manipulée pour dire n’importe quoi. La dernière mise à jour permet à ces clones IA de parler couramment des langues telles que le suédois, l’arabe et le malais.

Préoccupations éthiques

Malgré les avantages potentiels, des inquiétudes subsistent quant à la mauvaise utilisation de cette technologie. L’audio Deepfake pourrait rendre les utilisateurs vulnérables aux fraudes et aux campagnes de désinformation. ElevenLabs a fait face à des réactions négatives l’année dernière lorsque sa plateforme a été utilisée pour imiter et harceler des personnalités publiques. La société a depuis mis en place des mesures de sécurité plus strictes, mais les préoccupations éthiques demeurent.

Des grandes entreprises technologiques telles que Meta ont été critiquées pour avoir développé de puissantes IA génératives sans transparence totale. Meta a récemment dévoilé un outil de synthèse vocale basé sur l’IA appelé Voicebox, qu’il a reconnu comme pouvant faciliter la création de Deepfakes. Cependant, Meta s’est abstenu de toute publication publique en raison des « risques de mauvaise utilisation ».

Malgré ces préoccupations, les progrès rapides dans le clonage vocal IA semblent être imparables. Comme l’a déclaré le linguiste Mati Staniszewski d’ElevenLabs, « Nous espérons finalement couvrir encore plus de langues et de voix grâce à l’IA et éliminer les barrières linguistiques pour le contenu. »

Le défi consiste à assurer une mise en œuvre éthique. La frontière entre la désinformation mondiale et les moyens innovants de communiquer est très mince, et il est essentiel d’agir avec prudence.

Dans le monde en constante évolution des cryptomonnaies et de l’IA, des plateformes comme cryptoview.io jouent un rôle essentiel en fournissant des informations à jour et pertinentes. Restez au courant des actualités et des mises à jour sur les cryptomonnaies avec cryptoview.io.

Découvrez-en plus sur Cryptoview.io

Contrôlez les RSI de tous les marchés crypto

RSI Weather

Tous les RSI des plus gros volumes en un clin d'œil.
Utilisez notre outil de visualiser instantanément le sentiment du marché ou uniquement de vos favoris.