Tecnologías perceptivas o cómo amar a una máquina

El desarrollo de las tecnologías perceptivas (reconocimiento de voz, gestos y movimientos) está llevando la informática personal a una nueva dimensión transformando nuestra relación con ordenadores o móviles.

Cuando era pequeña, tenía un oso de peluche (aún lo conservo). Dormía con él todas las noches. Era mi amigo. De hecho, era “el único que me entendía”. O al menos eso creía yo y así se lo decía. En voz alta. Le contaba mi día a día, mis problemas, mis secretos. Un día dejé de hablarle. Quizá porque crecí. O quizá porque nunca me contestó.

¿Y si un día ese osito me hubiera escuchado y respondido? No es nada descabellado. A inicios del año pasado, Mattel presentó su Hello Barbie (o “la Barbie Espía”, como muchos la han bautizado), una versión de la icónica muñeca con la que hablar y… ¡obtener respuesta!. ¿Cómo funciona?. Las conversaciones son grabadas a través de un micrófono en su cinturón y enviadas por Wi-Fi a un servidor central en la nube, donde a través de inteligencia artificial se prepara y envía una respuesta personalizada que el niño escucha a través de un altavoz. ¿Qué te parece?, ¿se la regalarías a tus hijos?.

hello barbie reconocimiento de voz

Polémicas o discusiones sobre seguridad y privacidad de los más pequeños al margen, esta Barbie es solo un pequeño anticipo de los grandes desarrollos tecnológicos que nos esperan a la vuelta de la esquina. No hay marcha atrás, la revolución ha comenzado y las tecnologías perceptivas, aquellas que se basan en el reconocimiento de voz, gestos y movimientos, serán las que nos lleven a una nueva dimensión en la que “conversar” con tus dispositivos electrónicos será una experiencia cotidiana totalmente natural e integrada.

«Oye, Siri», «ok, Google», «hola, Cortana», «¡Alexa!», “hi, Sirius”

Desde hace varios años los gigantes tecnológicos compiten por avanzar posiciones en el campo de los asistentes virtuales inteligentes. Cortana, desarrollado por Microsoft, es un ejemplo real de tecnologías perceptivas que te permite la interacción por voz con tu teléfono u ordenador. “Hola Cortana”, “¿dónde estoy?”, “¿hay alguna pizzería barata abierta cerca de aquí?”, “despiértame a las 6:00”, “recuérdame que llame a mi madre a la salida del trabajo”, “sugiéreme algunos ejercicios para bajar de peso”, “¿cuántas calorías tiene un huevo?”, “pon un poco de rock”, “cántame una canción”, “cuéntame un chiste”, “¿dónde naciste?”, “¿cuántos años tienes?”. Estas son algunas de las cosas que le puedes decir a Cortana para que el asistente te ayude o establecer una conversación. Y la recomendación es que superes la sensación de ridículo y lo hagas con la misma naturalidad (o casi) con la que hablarías con una persona que está sentada a tu lado.

cortana reconocimiento voz tecnologías perceptivas

Si eres de Apple, tu asistente se llama Siri. Aunque hace años que la conocemos, es con el iPhone 6s con el que parece que ha llegado definitivamente para quedarse. “Oye, Siri”, puedes gritarle a unos metros de distancia, y la asistente robótica cobrará vida. Y Siri no sólo te ayudará como lo haría Cortana sino que podría incluso apagar las luces de tu casa, si cuentas, claro, con el sistema de automatización del hogar HomeKit de Apple.

Google te escucha con Google Now y Amazon lo hace con Echo, que responde al nombre de Alexa. A todas estas propuestas de productos comerciales se suma Siriusun programa de código abierto que combina el reconocimiento de voz y de imágenes. Muéstrale una foto de un restaurante y pregúntale a Sirius “¿cuándo cierra este local?”.

Mi máquina me entiende

Hace un par de semanas, Eduardo Arcos, CEO y fundador de Hipertextual, explicaba en el marco del Intel Trends Day, que “la tecnología siempre ha sido un humano interactuando con una máquina, pero siempre le has tenido que decir tú qué hacer. A medida que esa máquina tiene ya un contexto de ti, empieza a entenderte cada vez mejor y, por lo tanto, esas barreras de aprendizaje empiezan a desaparecer. La tecnología pasa a ser invisible y las personas empiezan a interactuar de una forma natural”.

Siguiendo su explicación, es fácil imaginarse un escenario en el que nuestros dispositivos electrónicos no solo respondan a órdenes, sino que a través de una escucha pasiva, analicen la situación y se anticipen a nuestras necesidades. Si le has dicho a tu mujer que no queda leche, el ordenador lo añadiría a la lista de la compra. Si telefónicamente cierras una cita con el dentista, el ordenador la apunta en tu agenda y programa el recordatorio. Si comentas que el nuevo tema de Adele es buenísimo, el ordenador lo incluye en tu playlist.

intel realsense tecnologías perceptivas

¿Y qué pasa si a las posibilidades del reconocimiento de voz añadimos tecnologías perceptivas de detección de figuras humanas y reconocimiento de gestos y emociones faciales?. Contamos ya en el mercado con Intel RealSense, que incluye funciones de seguimiento de movimientos de manos y dedos, análisis del rostro o realidad aumentada. Esta tecnología, integrada en Windows Hello, logra que la cámara reconozca el rostro del usuario diferenciando incluso a parejas de gemelos idénticos. Parece que puedes ir diciendo adiós a las inseguras claves de acceso. Y siguiendo con las despedidas… el teclado y el ratón tienen los días contados. Ya es posible jugar sin necesidad de usar el tacto, sólo con el movimiento de tus manos y brazos; hacer garabatos en el aire y que aparezcan en la pantalla; escanear cualquier objeto de tu entorno o incluso tu propia cara para crear luego una versión digital en 3D; comunicarte con tu ordenador a través de un saludo o tu sonrisa. Las posibilidades son casi infinitas.

¿Es posible enamorarse de un teléfono o un ordenador?

¿Has visto la película Her? Si no lo has hecho, te la recomiendo encarecidamente. En ella, su protagonista, interpretado por Joaquin Phoenix, vive una historia de amistad y amor con Samantha, un sistema operativo de inteligencia artificial con la sugerente voz de Scarlett Johansson. Tecnología, evolución, sentimientos, soledad y conexión son ingredientes de una reflexión muy interesante sobre nuestro futuro y nuestra relación con las máquinas.

Y aunque Siri no sea aún una asistente tan evolucionada como Samantha, también levanta pasiones. Raj, uno de los personajes de Big Bang Theory mantiene una divertida relación con su teléfono que, además de hacernos reír nos invita de nuevo a pensar en la capacidad de las tecnologías perceptivas para transformar nuestra vida.

raj conversa con siri. Big Band Theory

Con Raj y su adorada Siri vemos también como aún hay obstáculos en el horizonte y las tecnologías perceptivas deben ir perfeccionándose para superar los retos a los que se enfrentan. Por ejemplo, los programas de reconocimiento de voz deberán pasar de entender literalmente nuestras palabras a interpretar lo que realmente queremos decir y, para lograrlo, es necesario que aprendan de nosotros, que sean capaces de crear un contexto, de entendernos y de evolucionar. Si hacemos caso a Xuendong Huang, responsable de las tecnologías de voz en Microsoft, esta realidad está muy cerca y “en los próximos cuatro o cinco años, los ordenadores serán tan buenos como los seres humanos” a la hora de entender las palabras que salen de nuestra boca, lo que podría ser la antesala de la construcción de una inteligencia artificial real. ¿Samantha?. Ray Kurzweil, director de ingeniería de Google, cree que “ella” será posible en 2029. Y va más allá del filme al afirmar que incluso podría contar con sistemas virtuales que transmitan sensaciones de tacto o besos.

¿Tu también dices ya sin reparos «Oye, Siri», «ok, Google», «hola, Cortana» o «¡Alexa!», “hi, Sirius”?. Si no lo haces, pronto lo harás porque nos encontramos en el preludio de una era completamente nueva de interacción con la tecnología. Sin llegar a los extremos de Raj o del protagonista de Her, vivamos y disfrutemos de nuestro particular idilio hombre-máquina.

Sobre el autor

RELACIONADOS

GPTs Custom

Cómo hacer GPTs Custom

Hace unos meses, OpenAI presentó una nueva función para ChatGPT, el popular chatbot de la compañía que funciona gracias a GPT-4, su modelo de...