IA Robots Skills Empleo

Computer Vision: en qué consiste y cómo te afectará esta tecnología clave para la robótica y la automoción

Gracias a los asistentes virtuales y a herramientas como ChatGPT o Bard empezamos a acostumbrarnos a eso llamado inteligencia artificial. Un campo de conocimiento muy amplio y que, en mayor o menor medida, abarca cualquier aspecto de nuestra sociedad. Un proceso similar al que supuso la llegada de la informática y de Internet a nuestras vidas. Una de sus áreas más prometedoras tiene que ver con la capacidad de las máquinas de ver, analizar y comprender el mundo que las rodea. Hablamos de visión artificial o computer vision.

IBM define la visión artificial como “un campo de la inteligencia artificial (IA) que permite a los ordenadores y sistemas extraer información significativa a partir de imágenes digitales, videos y otras entradas visuales, y tomar medidas o realizar recomendaciones en función de esa información. Si la IA permite a los ordenadores pensar, la visión artificial les permite ver, observar y comprender”. Por su parte, Microsoft habla de computer vision como “un campo de la informática que se centra en permitir que los ordenadores identifiquen y entiendan objetos y personas en imágenes y vídeos. (…) Busca realizar y automatizar tareas que replican las capacidades humanas. (…) Tanto la forma en que los humanos ven como la forma en que los humanos dan sentido a lo que ven”.

Que un modelo de inteligencia artificial sea capaz de ver y comprender lo que ver es parte importante del machine learning y de las redes neuronales. Precisamente, el proceso de aprendizaje de una IA la capacitará para realizar tareas más complejas. De manera autónoma y sin una supervisión constante. Y haciendo un símil con el ser humano, la vista es uno los sentidos más importantes que tenemos para desenvolvernos en el mundo que nos rodea.

Visión humana frente a visión artificial

“La visión artificial funciona de manera muy similar a la visión humana, excepto que los humanos tienen una ventaja inicial. La vista humana tiene la ventaja de toda una vida de contexto para entrenar cómo distinguir los objetos, a qué distancia están, si se están moviendo y si hay algo mal en una imagen”. Es decir. Las máquinas parten de cero. Así que necesitan que esa computer vision sea lo más completa posible. Pero una vez salvado este gran escollo, los resultados son prometedores. “Un sistema entrenado para inspeccionar productos o ver un activo de producción puede analizar miles de productos o procesos por minuto, detectando defectos o problemas imperceptibles, puede superar rápidamente las capacidades humanas”.

Precisamente, para que la visión artificial logre su propósito, son necesarias dos tecnologías claves en el desarrollo de la inteligencia artificial: el deep learning, que forma parte del machine learning, y las redes neuronales convencionales, en inglés, convolutional neural networks. Mediante modelos algorítmicos, un ordenador puede enseñarse a sí mismo el contexto de los datos visuales. Siempre y cuando esos modelos procesen la suficiente cantidad de datos a su disposición. En este caso, en forma de imágenes, fotografías y videos

Computer Vision

¿Para qué puede servir la ‘computer vision’?

La buena noticia es que la computer vision o visión artificial no es algo para lo que debamos esperar décadas o años. Ya hace tiempo que llevamos utilizándola. Sin ir más lejos, para traducir carteles y mensajes a través de la cámara del teléfono. O para que tu aspiradora inteligente trabaje solamente por las zonas que tú le dictes y mantenga limpie esas áreas específicas mientras tú no estás. A corto, medio y largo plazo, tecnologías como la robótica o los vehículos autonómos van a experimentar grandes mejoras gracias a la visión artificial. Ya que les permitirá aprender más rápido y desempeñar sus tareas de manera autónoma.

La visión artificial consta de varias funciones que explican su importancia en el desarrollo de la inteligencia artificial. Y que, de paso, explican la complejidad que supone la visión humana y lo mucho que dependemos de ella. La denominada en inglés computer vision permite clasificar los objetos a partir de categorías definidas. Un ejemplo que vemos en nuestro día a día es cuando la cámara de nuestro teléfono detecta rostros para enfocarse automáticamente. O cuando clasifica nuestras viejas imágenes según si aparecen en ella personas, mascotas o lugares de interés.

Relacionado con la clasificación, la visión artificial también es importante porque permite identificar objetos. No solo diferencia personas de objetos o animales. También determina por qué es una persona y qué la diferencia de otras. Y a partir de ahí, es posible el seguimiento de objetos. Muy útil, por ejemplo, para gestionar el tráfico o para monitorizar una cadena de montaje inteligente.

La conducción autónoma necesita la visión artificial para hacerse realidad

Visión artificial y conducción autónoma

Todavía estamos lejos de ver la conducción autónoma implementada por completo en nuestras calles y carreteras. Estamos todavía en una fase intermedia. Muy avanzada si echamos la vista atrás, pero que todavía requiere de un conductor experimentado para manejar el automóvil. Por suerte, las ayudas y automatizaciones en carretera son cada vez más avanzadas y descargan mucha responsabilidad en el conductor.

Uno de los pilares para alcanzar la conducción autónoma es la visión artificial o computer vision. Que el vehículo analice, procese y entienda la carretera, los demás vehículos, los peatones y las señales que encuentre a su alrededor, son algunas de las claves para que un automóvil circule de manera autónoma y sin que tengamos que tener las manos al volante. En ese sentido, distintos grupos automovilísticos trabajan en sistemas de este tipo. Cada uno con aproximaciones distintas pero similares. Nissan cuenta con un sistema llamado ProPILOT que trabaja integrando el navegador GPS y los sensores 360 del propio vehículo. Por su parte, Tesla cuenta con un sistema de conducción autónoma llamado Full Self-Driving (FSD), que promete conducción autónoma total.  

Sea cual sea el sistema que mejor evolucione, la inteligencia artificial es, y será, imprescindible para que un turismo, un camión o un barco de grandes dimensiones se puedan mover con autonomía sin la intervención humana. Pero para ello tendremos que esperar alguna que otra década más. Dependerá del tiempo que necesiten los modelos de algoritmos para aprender a “conducir” por su cuenta y con la ayuda de los técnicos e ingenieros que trabajan ahora en los futuros sistemas autónomos.

RELACIONADOS

Google Docs

30 trucos para Google Docs que desconocías

Google Docs es una de las herramientas más útiles para escribir documentos. Es gratuita, se sincroniza con tu cuenta de Google y cuenta con...