Tecnología

La tecnología de Microsoft alcanza el mismo nivel que un humano en reconocer una conversación

Si alguna vez has curioseado algo sobre la historia de la inteligencia artificial, sabrás que uno de los hitos que se consideran importantes con respecto a esta ciencia o tecnología es la posibilidad de que una máquina o un programa sean capaces de traducir entre dos idiomas con la misma efectividad y precisión que un humano. Por desgracia, ese hito no se ha cumplido todavía, aunque los traductores automáticos cada vez hacen un mejor trabajo; pero según Microsoft sus sistemas de reconocimiento de voz ya han alcanzado un nivel en la transcripción del habla en una conversación que se iguala con la de un humano, lo que sin duda también es un importante hito en tecnología.

Según Microsoft, el índice de errores del sus sistemas es de un 5,9 por ciento, lo que se iguala, según la compañía, al que consiguen transcriptores profesionales a los que se les pidió trabajar en locuciones extraídas de las mismas conversaciones. El sistema de Microsoft emplea modelos neuronales de lenguaje que agrupan palabras similares, lo que permite una generalización eficiente. Como te puedes imaginar, el primer lugar al que va a ir a parar esta tecnología es al asistente de voz Cortana, tanto para los sistemas que usan Windows 10 como en sus consolas Xbox y en todos sus sistemas de transcripción de voz a texto.

Aunque los resultados son al parecer impresionantes, la batalla de las tecnologías de reconocimiento de voz no ha concluido ni mucho menos. como sabrás, asistentes como Google Now (o Google assist) y Siri son ejemplos de duros competidores que han mejorado sustancialmente también su potencia para transcribir e interpretar las órdenes en lenguaje natural (aunque algunas usan tecnologías de terceros para la parte de reconocimiento) y otras grandes compañías como IBM o Samsung están también muy volcadas en estos sistemas de aprendizaje, tecnologías cognitivas o de inteligencia artificial en general (la propia Apple está últimamente llevando a acabo algunos fichajes muy llamativos en este campo).

Además, la nueva tecnología de Microsoft todavía tiene que ponerse a prueba en un mayor rango de situaciones reales y con mayor rango de tipos de voz. Por supuesto, todo lo que conlleva el reconocimiento no es más que una pequeña parte de la inteligencia artificial que será necesaria para que los ordenadores realmente “entiendan” lo que significan nuestras palabras para después interpretarlas correctamente o traducirlas a otro idioma. En cualquier caso, es posible que muy pronto, la tarea de dictar o dar órdenes a los asistentes de voz sea mucho más sencilla y efectiva.