Google Now, Siri y la quimera del mayordomo virtual perfecto

No hay película de ciencia ficción que se precie donde no seamos capaces de hablar con un ente virtual que resuelva todas nuestras necesidades en lenguaje natural. El famoso Michael Knight hablando con KITT en El Coche Fantástico o las conversaciones con HAL en 2001 Una Odisea del espacio son sólo un par de ejemplos. El más llamativo de los últimos años es el de la película Her en la que Joaquin Phoenix se enamora de Samantha (un sistema operativo cuya voz interpreta Scarlett Johansson, quizá un punto que pueda justificar ese enamoramiento).

El objetivo fundamental de todos estos interfaces (y me voy a permitir reducirlos a un interfaz olvidando la lógica transaccional o de operación que se aplique por detrás) es siempre el mismo: reconocer de forma sencilla necesidades complejas de los usuarios, y llevarlas a cabo. Esta es una de las promesas de Siri, la famosísima asistente vocal de Apple, posiblemente el software que más ofertas de matrimonio ha recibido. Sin embargo, y por más que le pese a algún fan de Apple, aún hay un importante recorrido de mejora: A mí por lo menos Siri en bastantes ocasiones no me comprende o no resuelve mis problemas (¿demasiado humana quizá? XD). Y las alternativas de la competencia S Voice de Samsung o Cortana de Microsoft no aportan una solución mucho mejor.

Aunque la vía del lenguaje natural vocal parece que es la más atractiva, quería resaltar dos tendencias en el mundo de los ‘mayordomos virtuales’ (o virtual concierges en su nombre inglés): La de los asistentes contextuales como Google Now y la de los bots de mensajería.cortana_

Google Now on Tap, aunque es también un asistente por voz, tiene una característica diferencial: Emplea toda la información de contexto para mejorar los resultados. Imaginemos por ejemplo que un amigo nos ha mandado un correo proponiéndonos cenar en un restaurante. Si acudimos a Google Now en ese momento, nos dará la información del establecimiento sin que se la tengamos que pedir explícitamente, dándonos opciones relacionadas con el restaurante, mapas, etc. Generalizando esta experiencia, Google Now nos ofrecerá en cada momento una serie de opciones contextualizadas que serán las que guíen toda nuestra navegación por el dispositivo, incluso seleccionando qué Apps cree que son relevantes para nosotros en ese momento. Las Apps como plataforma perderían por tanto mucho peso en cuanto al descubrimiento, y no digamos ya la navegación por los menús.

La otra tendencia en estos interfaces, que me atrae aún más porque supone una brecha en la hegemonía de los grandes del negocio, es la de los bots de mensajería: Son también asistentes virtuales pero con los que nos comunicamos dentro de este tipo de aplicaciones: Telegram, WeChat o Line por ejemplo. Se trata de un contacto más con el que podemos mantener una conversación en la que nos suministre información o servicios en los que el bot sea experto. Gracias a la apertura de estas plataformas (con APIs de programación), cualquiera puede realizar un bot especializado en una tarea y ponerlo a disposición de los usuarios (mejor dicho, de sus clientes) para que interactúen con él. Dado que los usuarios dedican un buen porcentaje del tiempo en sus Smartphones a las aplicaciones de mensajería, muchas de las tareas livianas y poco repetitivas que hacemos con las aplicaciones (como ver el saldo de la cuenta bancaria o comprobar si hay mesa en un restaurante antes de reservar) se podrían pedir con lenguaje natural a estos bots. Los bots a su vez serían capaces de hablar con otros bots y generar flujos complejos de servicios. La ventaja de una interacción escrita con respecto a la vocal es la permanencia de la información, que podría permitir realizar transacciones reales (“quiero contratar el pack Series de MoviStar TV”) dentro de un entorno autenticado

Podríamos así poner a nuestros bots a hablar con los bots de nuestros amigos para que entre ellos eligieran restaurante y hora de acuerdo a nuestras agendas, tras conversar con algún bot experto en restaurantes cuál es la mejor opción. A nosotros nos llegaría la solución. No sé si emocionarme o asustarme con esta posibilidad.

Al igual que con el caso de Google Now, de imponerse los bots de mensajería el peso de las Apps y de la estructura de los menús de los dispositivos disminuiría considerablemente. Pero ésta ha sido la promesa de cualquier intento de acercarse al ‘interfaz definitivo’. Y de momento y por mucho tiempo no creo que se alcance. Eso sí, esta lucha por la interacción perfecta es cada vez más humana: Como ejemplo, podéis preguntarle a Siri qué opina de su joven competidora Cortana, no tiene desperdicio.

 

Sobre el autor

RELACIONADOS