reconocimiento de voz

El reconocimiento de voz: una interfaz para dominarlos a todos

La expansión del reconocimiento de voz a sectores tecnológicos diversos sitúa a esta interfaz como una de las más viables para la comunicación con las máquinas en el futuro.

A partir del lanzamiento de Siri, en octubre de 2011 coincidiendo con la presentación del iPhone 4s, es cuando de verdad se le ha empezado a prestar atención al reconocimiento de voz. Y es que esta tecnología lleva funcionando desde hace varias décadas. Eso sí, se ha perfeccionado mucho desde que el primer sistema, nacido en 1952 de la mano de Bell Laboratories. Con el paso del tiempo se ha expandido a muchas áreas y ha alcanzado un nivel de precisión que hace unos años era difícil pensar, gracias al aumento de la potencia en el hardware y a los avances en software.

El reconocimiento de voz que ya incorporan los smartphones es quizá la parte más visible de esta tecnología, que está presente en los sistemas de atención telefónica al cliente de muchas compañías. Cada vez se le está dando más uso en los móviles, sobre todo debido a que la interfaz táctil es muy útil para navegar pero no lo es tanto para introducir texto. Y precisamente para esta tarea resulta bastante adecuado el reconocimiento de voz.

La introducción de texto es básica para el uso de Internet, desde las búsquedas hasta los mensajes que se envían a otras personas, ya sea a través de email o cualquier otro servicio. El teclado físico desempeña esta tarea con soltura en el ordenador, pero otras interfaces no tienen tanto éxito. Los dispositivos wearable, por ejemplo, también se sirven de la funcionalidad táctil o botones físicos, que puede convertir en tediosas tareas sencillas.

reconocimiento de voz

En un smartwatch el reconocimiento de voz permite buscar transversalmente a través del menú, ejecutando directamente la función requerida. Actualmente existen técnicas para que el ruido de fondo no afecte a la comunicación.

Pero los wearable no son los únicos dispositivos smart que están adoptando esta tecnología. Muchas smart TV incluyen un mando a distancia que reconoce las instrucciones del usuario, atajando procesos que de otra manera requerirían más tiempo. Por ejemplo, es posible buscar en un servicio de streaming películas de un determinado director o en las que salga un actor, algo para lo que sin la voz se necesitarían varios pasos.

Otra de las grandes áreas donde se está explotando el reconocimiento de voz es el coche conectado. La introducción de los sistemas de infotainment –contracción de information y entertainment– ha motivado el surgimiento del reconocimiento de voz como la interfaz más adecuada. Es segura, puesto que deja las manos libres al conductor, y es capaz de acortar el proceso para llegar al objetivo final. Actualmente todos los sistemas de las marcas de coches están incluyendo esta posibilidad.

Como último sector reseñable cabe destacar la tecnología de dictado, que se puede utilizar en diversas áreas. El mundo de la salud es uno de los más indicados para el uso del reconocimiento de voz. Uno de los motivos es que las prisas a veces impiden a los médicos escribir toda la información relativa a un paciente, dejando de lado detalles de menor importancia. Sin embargo, con el dictado el proceso es mucho más rápido y la información puede ser más completa, lo que beneficiará al paciente para una próxima consulta.

Imágenes: LJR.MIKE y Janitors

RELACIONADOS

astronauta-astrobee-robot

Astrobee, el robot ayudante de los astronautas

Desde aspiradoras que mantienen limpios los suelos de nuestras casas a dispositivos que asisten en operaciones a corazón abierto. Los robots se diseñan para...