Tecnología
Inteligencia Artificial

Voice Engine da miedo: la herramienta para clonar voces de OpenAI

  • Nacho Grosso
  • Cádiz (1973) Redactor y editor especializado en tecnología. Escribiendo profesionalmente desde 2017 para medios de difusión y blogs en español.

Como sabrás, Open AI es la empresa que está detrás de la popular ChatGPT o Sora, la herramienta para hacer videos realistas mediante inteligencia artificial. Ahora va un paso más allá, ya que an uncía su proyecto Voice Engine, capaz de clonar una voz con solo 15 segundos de escucha. Sí, la que se nos viene encima es sorprendente.

Voice Engine, una herramienta en desarrollo

Este proyecto comenzó a finales de 2022 y la firma Open AI lo ha dado a conocer en su blog esta semana pasada. Bastarían solamente 15 segundos de voz de una referencia para que Voice Engine sea capaz de realizar el aprendizaje y, posteriormente, crear una voz muy similar. Si deseas escuchar un ejemplo lo puedes comprobar aquí con la voz que es la de referencia y la que consigue reproducir mediante Voice Engine. Sí, es algo asombroso.

Automáticamente, lo primero que se nos viene a la cabeza son los usos indebidos de este tipo de herramientas. Falsear voces, hacer se pasar por otras personas, fakes news y demás. Sí, nuestra mente siempre se pone del peor lado. Sin embargo, Voice Engine puede que nunca vea la luz de manera comercial al igual que lo ha hecho Chat GPT. Puede que quede restringido a empresas que le puedan proporcionar un uso eficiente y de valor.

Podemos pensar en personas que hayan perdido el habla y estén en capacidad de recuperarla, que los niños tenga la posibilidad de desarrollar habilidades lectoras con voces naturales, o tener una comunicación más natural con habitantes de regiones remotas con idiomas no muy hablados. También se perfila como un recurso excelente para tener unas traducciones mucho más eficientes y sin ‘contaminaciones’ de otras variantes, por ejemplo, del español de España al de Argentina, por poner un ejemplo.  Las posibilidades de Voice Engine son enormes.

De lo que no cabe duda es que este recurso es uno más a sumar a la gran cantidad de herramientas que van surgiendo gracias a la Inteligencia Artificial. De hecho, ya la utilizamos en apps como WhatsApp gracias a la asistente LuzIA, desarrollada en España. O bien, podemos crear imágenes imposibles gracias a DALL·E. Algo que parecía imposible hace unos años y que ya podemos hacer desde. nuestro teléfono móvil. Voice Engine suena ya casi a ciencia ficción, pero no deja de ser un avance de gigante en la manera en la que interactuamos con los avances en los lenguajes de programación.