Cuidado, Google te puede leer los labios

Este software, que se ha denominado LipNet, que lo que hace es tomar una foto en cada frase, pero ahora deben conseguir mejorar el porcentaje de lectura labial en vídeos, la meta de Google.

0
4 views
AI de Google consigue leer los labios

El departamento de Inteligencia Artificial de Google ha desarrollado un sistema capaz de leer los labios de las personas, únicamente mediante la observación del interlocutor.

Es una buena noticia para todos aquellos que tienen algún tipo de problema en la audición, pero también va a revolucionar las tecnologías de espionaje, en todos sus aspectos. De hecho, a menudo en el fútbol se realizan informes de lectura de labios, tema muy candente en la actualidad. Últimamente, hablando de este deporte en concreto, le damos mucha importancia a las conversaciones que mantienen los jugadores en el campo, entrenadores, árbitros… y parece casi más importante esa conversación que la jugada en cuestión.

Y con la actualidad de su parte, Google lleva a cabo este desafío para conseguir más precisión en la lectura de labios.

Una gran tecnología conlleva una gran responsabilidad

Los investigadores de la Universidad de Oxford y DeepMind, departamento de Inteligencia Artificial de Google, han creado este software utilizando el ver, escuchar, atender y deletrear.

Tras dedicar miles de horas a aprender a leer los labios, parece que han conseguido descifrar hasta el 46,8% del contenido de una conversación. Puede parecer que este porcentaje no es muy innovador, pero hay que tener en cuenta que una pantalla lea los labios es lo suficientemente innovador si lo comparamos con el 12,4% que se conseguía descifrar anteriormente. Comparando datos sí parece revolucionario.

Este software, que se ha denominado LipNet, golpeó la tasa de precisión del 93,4% en su fase experimental, pero sin olvidar que eran personas físicas quienes hacían el estudio.  LipNet lo que hace es tomar una foto  en cada frase de los voluntarios, pero ahora lo que verdaderamente deben conseguir es mejorar el porcentaje de lectura labial en vídeos, la meta de Google. Pero insisto, rondar el 50% descifrando una conversación es una gran noticia.

La suma total de horas que Google ha invertido en descifrar un vídeo a través de este software superan las 5.000 horas. Utilizaron herramientas como Newsnight, Question Time o World Today. Con estos programas y 118.000 piezas de diferentes frases han conseguido desarrollar esta gran idea.

DeepMind apuesta por diversificar en este campo para mejorar la ayuda que pueden prestar a gente con alguna discapacidad auditiva, anotaciones en películas mudas o aumentar la precisión de reconocimiento por voz como Siri o Alexa.

Cabe destacar que los investigadores han confirmado que las imágenes tomadas en HD con una iluminación intensa consiguen una mayor precisión que con imágenes de una calidad baja en la velocidad de fotogramas.  Por suerte la tecnología sigue avanzando para todos.

No hay comentarios

Dejar respuesta