El entrenamiento de Aura forma parte del proceso de aprendizaje de la Inteligencia Artificial de Telefónica. En este sentido, los niños y, sobre todo, sus voces, tienen mucho que aportar.
Para entrenar Aura, desde la unidad de CDO de Telefónica, se convocó recientemente a varios padres y sus hijos, niños con edades comprendidas entre los 5 y los 7 años, cuyas voces se grabaron con distinto volumen y entonación, utilizando el comando de voz “OK Aura”, con el fin de dotar a la IA de más información para mejorar su aprendizaje.
Tras la grabación de las voces, Chema Alonso, CDO de Telefónica, animó a los niños a jugar con Aura para que le enseñaran a reconocer animales mediante distintos movimientos. Dichos movimientos formaban parte de su entrenamiento, y quedaban registrados por la cámara del dispositivo Movistar Home a través de un juego especialmente implementado para llevar a cabo el entrenamiento. De este modo, los niños pudieron descubrir las distintas posibilidades de aprendizaje de una Inteligencia Artificial.
Uno de los puntos fundamentales en los que está trabajando el equipo de Producto de Movistar Home, liderado por Óscar Mancebo, es entrenar Aura con voces de niños. En palabras de Mancebo, “Movistar Home es el dispositivo que abre la puerta de nuestros hogares a la Inteligencia Artificial de Telefónica y, por tanto, debe permitir la interacción vocal con cualquier miembro de una familia, siendo capaz de entender cualquier tipo de voz, tanto de adultos como de niños”.
La comprensión de voces y acentos
En lo que respecta a voces y acentos, Ana Molina, del departamento de diseño de experiencia e investigación, nos desveló algunas de las claves de la forma que tiene de comprender e interpretar distintos tipos de voces y acentos en el reportaje Cómo piensa Aura, la Inteligencia Artificial de Telefónica.
Molina comentó que existen reconocedores de voz que utilizan la tecnología ‘speech to text’ que traducen las palabras que dicen los usuarios a una cadena de texto. Dichos reconocedores se entrenan para ser capaces de entender al máximo a los usuarios. Asimismo, afirmó que, “esa cadena de texto es lo que realmente llega al motor de Aura para que lo procese y pueda contestar al usuario”.