Microsoft

Vasa, descubre la IA se Microsoft y qué puedes hacer con ella

Microsoft, Apple, Inteligencia artificial, Bruselas, Comisión Europea,

La Inteligencia Artificial es una de las innovaciones más importantes de los últimos años, y no hay corporación tecnológica que no esté presentando plataformas que integren estas funciones avanzadas. Vasa, la IA de Microsoft, es una de las últimas apuestas en este campo, y posee algunas características interesantes que deberías conocer si eres un entusiasta de la IA. ¿Sabes qué contenidos será capaz de generar el nuevo producto de los de Redmond?

A través de un comunicado en su web, Microsoft confirmó el lanzamiento de VASA-1, como han denominado oficialmente a este servicio que, entre otras cosas, podrá generar avatares hiperrealistas de los usuarios a partir de una imagen y un mensaje de voz.

Lo que hará la Inteligencia Artificial es interpretar los archivos, dándoles vida a las fotografías al añadir expresiones al mismo tiempo que sincroniza el movimiento de la boca con el mensaje de voz que hemos adjuntado. Hechas las primeras pruebas, debemos admitir que los resultados son sorprendentes y que esto revolucionará la forma en la que interactuamos.

¿Cómo funciona Vasa, la IA de Microsoft?

Los desarrolladores han comentado que captura un sinfín de expresiones humanas, incluyendo los movimientos naturales de la cabeza, los ojos y la boca, generando así avatares «parlantes» con un nivel de realismo nunca antes alcanzado.

Estos resultados son posibles sólo gracias a la separación de rasgos faciales y corporales únicos de cada persona, como la posición de la cabeza y las expresiones, lo que les permite interpretar la esencia de cada individuo.

A su vez, eso facilita el control y la edición de cada uno de los rasgos, por lo que pueden corregirse aquellos que se consideren poco precisos o inexactos. Sumado a esto, VASA-1 va más allá de otros sistemas de Inteligencia Artificial al sincronizar el desplazamiento de los labios con la voz de manera separada.

Según los creadores de Microsoft Research, la clave está en que modelan «su distribución probabilística de manera unificada» para obtener patrones «reales».

Para que la generación de avatares fuera tan extraordinaria, los ingenieros de Microsoft entrenaron su IA con una gran cantidad de sujetos que hablaban. Lentamente, y por medio de códigos concretos, la Inteligencia Artificial fue detectando la probabilidad de que hagamos tal o cual movimiento al hablar.

Transcurrido el tiempo, identificados los patrones predominantes, lograron cambiar las expresiones de los avatares sin que eso afecte su identidad.

Los enfoques 3D fueron esenciales para recopilar detalles del rostro de los participantes voluntarios, que sirvieron como base para que la IA sepa cómo solemos movernos en espacios tridimensionales.

Incluso, las miradas de estos avatares transmiten emociones porque así fueron entrenados. Y sobre la base de esas cabezas, luego se sincronizan los mensajes de voz. Como consecuencia de ello, los avatares pueden estar felices, enfadados, relajados y/o preocupados.

Vídeos de gran resolución gráfica

VASA-1 consigue reproducir vídeos de alta calidad, con una resolución de 512 x 512 píxeles, a 45 fotogramas por segundo. La definición de rostros y bocas es realmente increíble y, por momentos, daría la impresión de que estamos interactuando con un ser humano; y no con la representación digital de un ser humano.

Lo curioso es que el potencial de esta Inteligencia Artificial es tal que se pueden construir avatares con ilustraciones o pinturas, como la Mona Lisa. Seguramente jamás te habrías imaginado manteniendo una charla con la Gioconda, pero de la mano de la IA eso dejará de ser una utopía muy pronto.

El reciente progreso significativo de herramientas como DALL-E 3 y StyleGAN2 -ambos generadores de imágenes y retratos- es el que ha favorecido la moda de los avatares.

¿Cuál es el peligro de estas tecnologías?

Por supuesto, esta tecnología supone ciertos riesgos. Desde Microsoft se han apresurado a afirmar que están «explorando habilidades visuales afectivas» para personajes virtuales e interactivos, pero que de ningún modo están haciéndose pasar «por ninguna persona en el mundo real».

Y está claro que esa no es su intención inicialmente. Sin embargo, los más que cuestionables usos de otros avances tecnológicos a lo largo de la historia no nos invitan a ser optimistas.

¿Cuál es el principal peligro al que nos enfrentamos? Los expertos informáticos temen que los avatares hiperrealistas conduzcan a la desinformación, ya que bien podrían confundir a más de un espectador que ignore su existencia. Si los avatares son utilizados para proporcionar datos falsos, y no hay forma de que sean desmentidos antes de que causen daño, su tecnología será más negativa que positiva. Los especialistas aún se preguntan cómo evitará esto Microsoft.

Sin una respuesta para ese cuestionamiento, han afirmado que se oponen «a cualquier comportamiento que cree contenidos engañosos o dañinos de personas reales y estamos interesados en aplicar nuestra técnica para avanzar en la detección de falsificaciones». Muy pronto sabremos si con eso es suficiente… o no.

 

Lo último en Curiosidades

Últimas noticias