reconocimiento de objetos

Los últimos avances en reconocimiento de objetos

El reconocimiento de objetos se está volviendo cada vez más preciso, hasta el punto de reducir la tasa de error al 6,6%.

Desde el año 2010, el evento Large Scale Visual Recognition Challenge acoge periódicamente los últimos avances en reconocimiento de imágenes. La última edición ha estado dedicada al reconocimiento de objetos dentro de las imágenes y el nivel de precisión demostrado se ha duplicado respecto al anterior encuentro, mientras que la tasa de error se ha reducido a la mitad. Citando estos progresos los organizadores han definido el evento de este año como histórico, haciendo hincapié en el gran salto de rendimiento.

El formato del Large Scale Visual Recognition Challenge consiste en la presentación de algoritmos que se ejecutan en ordenadores de alto rendimiento, normalmente construidos en base a GPUs, para optimizar la potencia. Los diferentes proyectos que se presentan compiten en distintas categorías, que en esta ocasión iban desde la detección de objetos y su localización hasta su clasificación.

Han sido 38 participantes procedentes de 13 países los que han competido este año, con proyectos que incluían la localización y clasificación de grandes conjuntos de imágenes sacadas de sitios diversos de Internet, como Twitter, o el modelado de sistemas de visión biológica. Y es que el objetivo final es que las máquinas sean capaces de identificar imágenes al igual que lo hace el ojo humano, algo para lo que aún queda mucho camino por recorrer.

Más sencillo es ir corrigiendo errores año a año y perfeccionando los sistemas de inteligencia artificial poco a poco. En esta edición los resultados han obtenido un 43,9% de precisión en comparación con el 22,5% alcanzado en el encuentro precedente. La tasa de error también se ha mejorado, disminuyendo desde el 11,7% al 6,6%, tal y como indica la investigadora de la Universidad de Stanford (uno de los organizadores del evento, junto con la Universidad de Carolina del Norte, Google y Facebook) Olga Russakovsky.

La mayoría de los trabajos este año se han basado en la tecnología de redes neuronales convolucionales, un concepto de inteligencia artificial que definió en su versión moderna el francés Yann LeCun en 1998. Sin embargo, no ha sido hasta ahora cuando esta técnica se ha podido desplegar adecuadamente gracias al abaratamiento de la potencia de computación.

reconocimiento de objetos

Un detalle a tener en cuenta es que los participantes en el evento tienen la opción de revelar los detalles de sus algoritmos o mantenerlos como software propietario. Y en este caso todos los equipos que ganaron en alguna de las categorías escogieron compartir el conocimiento con los demás, una buena fórmula para impulsar la innovación a nivel general.

Imágenes: Daniel Lee, geralt

RELACIONADOS