parrotron

Parrotron: la IA de Google para ayudar a las personas con trastorno del habla

Esta nueva herramienta permitirá a las personas que sufren estas discapacidades poder crear discursos óptimos a través de su propia voz.

La comunicación entre las personas es determinante a la hora de construir nuestra identidad como sociedad. Es una de las principales maneras de crear comunidad.

Muchas veces, dicha comunicación no se tiene casi en cuenta por el mero hecho de que todos y cada uno de nosotros somos capaces de emplearla, por eso, generalmente pasa a un segundo plano en el ámbito cotidiano.

Pero al contrario de la afirmación anterior, la comunicación como tal, y el habla en general, son determinantes a la hora de poder entablar conversaciones, hacer discuros, etc. Es decir, es la manera óptima y directa de edificar un proyecto comunicativo global. De ahí su importancia.

Por eso, los trastornos derivados de la comunicación oral son muy importantes. Porque las personas que los sufren tienen una capacidad reducida de poder hacer todo lo dicho hasta el momento.

La IA al rescate para este tipo de trastornos

El equipo de Inteligencia Artificial de Google ha publicado recientemente el proyecto Parrotron. Se trata de un proyecto con el cual la compañía quiere salvar los problemas del habla.

La función del Parrotron es la de transformar los diferentes problemas relacionados con el habla en un nuevo lenguaje de características sintetizadas y de carácter fluido.

parrotron

Para ello, el equipo de Google se ha servido de un modelo de conversión de voz a voz estándar, al que luego han añadido patrones atípicos del habla comunes en personas con algún tipo de trastorno comunicativo.

Para este proyecto se ha cogido de referencia a la hora de probarlo a dos personas. Un investigador ruso y matemático de Google de nombre Dimitri Kanevsky y completamente sordo; y Aubrie Lee, defensora de la inclusión de discapacitados con una distrofia muscular que afecta a su comunicación oral.

Para Kanevsky se grabaron aproximadamente 15 horas de discurso, y gracias a Parrotron los investigadores pudieron entender de una manera óptima sus palabras. De hecho, y gracias a ASR de Google (motor de reconocimiento de lenguaje automático) se consiguió reducir la tasa de error por palabra de un 89% a un 32%. Lee, por su parte, grabó una hora y media que ayudó considerablemente a la realización del proyecto.

Con esta nueva aplicación, Google quiere entrar de lleno en la ayuda y salvaguarda del habla, facilitando así a las personas con trastornos la posibilidad de usar herramientas de voz y hacer más comprensibles sus discursos de cara a futuros escenarios comunicativos.

Si quieres seguir leyendo sobre IA, no te pierdas este post sobre Aura, la Inteligencia Artificial de Telefónica.

Sobre el autor

RELACIONADOS