Google DeepMind ya es capaz de leer los labios mejor que los humanos

El sistema de inteligencia artificial, aprendió a leer los labios viendo miles de horas de televisión

Por Manu Contreras ,
Foto (CC) Gage Skidmore/Flickr

La inteligencia artificial se anota un punto a su favor gracias a Google. Investigadores de la división de AI de Google -desarrolladora de DeepMind- y de la Universidad de Oxford han logrado crear un software para deducir las conversación a partir de los movimientos de los labios, que ha demostrado ser el más preciso del mundo.

Este sistema, que usa una red neural artificial, ha logrado acertar el 46,8% de las veces de media, mientras que humanos bajo la misma prueba, tan sólo lograron un 12,4%. Es una diferencia tan grande, que deja prácticamente a cualquier persona capaz de leer los labios sin trabajo.

Los investigadores usaron cientos de horas de vídeo de programas de la BBC para entrenar a sistema de inteligencia artificial. Es decir, se usaron planos de personas normales para que supiese qué es lo que decían. En comparación, otros sistemas capaces de leer los labios usaban vídeos de personas hablando claramente delante de una cámara.

lectura-de-labios

Con un total de 5.000 horas de vídeo para entrenarse, este sistema se ha enfrentado a más de 118.000 frases y 17,500 palabras únicas en inglés. Así que en comparación, sí, este sistema es bastante preciso.

Este software se podría instalar en un servidor de Google, o de cualquier otra empresa, y que con la cámara de un móvil se traduzca en tiempo real qué es lo que se está diciendo. Una herramienta de mucha ayuda para personas con deficiencias auditivas o incluso como herramienta de traducción sin usar la voz.

+ Info | ArXiv [PDF], The Verge

Compartir en:

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Últimos vídeos