A medida que el mundo de la inteligencia artificial (IA) continúa evolucionando a un ritmo exponencial, una startup con sede en San Francisco, ElevenLabs, ha hecho un anuncio innovador. Han desarrollado un nuevo modelo de IA que puede generar voz usando tu voz en 30 idiomas, un gran avance desde los originales ocho. Este avance está destinado a revolucionar los ámbitos de la clonación de voz y la comunicación multilingüe.
El Salto Multilingüe
ElevenLabs ha utilizado Lukeman Literary, una agencia literaria y editorial independiente, como caso de estudio para demostrar la eficacia de su tecnología. Lukeman produce numerosos audiolibros multilingües anualmente, un proceso que solía llevar semanas debido a la necesidad de encontrar al locutor adecuado, reservar un estudio de grabación y gestionar la postproducción. Ahora, gracias al modelo de IA de ElevenLabs, todo el proceso se puede completar en cuestión de horas.
El nuevo modelo Multilingual v2 puede ofrecer audio rico en emoción y captura las sutiles inflexiones del habla natural. Los usuarios pueden escribir el texto que desean que se hable en el idioma objetivo y la IA generará una locución fluida.
Opciones de Clonación de Voz
ElevenLabs ofrece dos herramientas principales de clonación de voz: una herramienta de texto a voz y un «VoiceLab» para clonar voces específicas. Los usuarios pueden cargar muestras de voz para crear un clon de voz personalizado, que la IA analiza para construir una versión sintética. Esta voz clonada luego se puede manipular para decir cualquier cosa imaginable. La última actualización permite que estos clones de IA hablen con fluidez idiomas como el sueco, árabe y malayo.
Abordando Preocupaciones Éticas
A pesar de los posibles beneficios, existen preocupaciones sobre el mal uso de esta tecnología. Los audios deepfake podrían hacer que los usuarios sean susceptibles a fraudes y campañas de desinformación. ElevenLabs recibió críticas el año pasado cuando su plataforma se usó para suplantar e acosar a figuras públicas. Desde entonces, la empresa ha implementado salvaguardias más estrictas, pero las preocupaciones éticas persisten.
Grandes empresas tecnológicas como Meta han enfrentado críticas similares por desarrollar potentes IA generativas sin una transparencia completa. Meta recientemente presentó una herramienta de síntesis de voz de IA llamada Voicebox, y reconoció que podría facilitar fácilmente deepfakes. Sin embargo, Meta se abstuvo de cualquier lanzamiento público debido a los «riesgos de mal uso».
A pesar de estas preocupaciones, el rápido avance en la clonación de voz de IA parece imparable. Como afirmó el lingüista Mati Staniszewski de ElevenLabs, «Eventualmente esperamos cubrir aún más idiomas y voces con la ayuda de la IA y eliminar las barreras lingüísticas para el contenido.»
El desafío radica en garantizar una implementación ética. La línea entre la desinformación global y las formas innovadoras de comunicación es muy delgada, y es clave proceder con cuidado.
En el mundo en constante evolución de las criptomonedas y la IA, plataformas como cryptoview.io desempeñan un papel esencial al proporcionar información actualizada y relevante. Mantente al tanto de las noticias y actualizaciones sobre cripto con cryptoview.io.
Descubre más en Cryptoview.io
