El gigante chino de las búsquedas Baidu ha obtenido un nuevo récord en reconocimiento de imágenes gracias a una supercomputadora que ha superado la anterior marca de Google.
El récord en reconocimiento de imágenes lo ostenta desde hace poco la compañía china Baidu. El gigante de las búsquedas asiático ha destronado a Google, cuya marca había sido la mejor hasta el momento. El causante de este vuelco ha sido la supercomputadora Minwa, que cuenta con 72 procesadores y 144 procesadores gráficos. Toda esta potencia se orienta al ‘deep learning’, una de las técnicas de inteligencia artificial que más están progresando en los últimos años.
En una prueba llamada Desafío de Clasificación ImageNet, la supercomputadora de Baidu utilizó 1,5 millones de imágenes etiquetadas en 1.000 categorías diferentes para entrenar sus sistemas. Esta base de datos se emplea para preparar a las máquinas para el reto, que consiste en clasificar 10.000 imágenes que el ordenador no ha visto antes.
Cuando Minwa realizó el desafío el porcentaje de error que obtuvo fue del 4,58%, según el documento aportado por Baidu como prueba de los resultados. En el mismo examen, Google había obtenido en marzo un 4,82% de margen de error, mientras que antes de eso Microsoft aireó su propia marca, un 4,94%. La de Microsoft fue la primera que se colocó por debajo de la barrera del 5,1%, un hito importante, pues este porcentaje está considerado como el promedio del rendimiento humano a la hora de reconocer imágenes.
Tras la presentación de los resultados de Minwa, Baidu queda como la compañía que ostenta el récord en reconocimiento de imágenes, por delante de Google y Microsoft. Una de las claves del éxito de la supercomputadora fue una técnica de software, que modificó 1,2 millones de las imágenes del entrenamiento, distorsionándolas, volteándolas o tocando el colorido, de manera que se convirtieron en 2.000 millones. Esto le permitió contar con una base de datos más variada y no depender tanto de detalles específicos para la clasificación.
La potencia de Minwa probablemente lo colocaría entre los 300 ordenadores más potentes del mundo si sus sistemas no estuvieran dedicados al ‘deep learning’. De hecho sus creadores opinan que se trata de la supercomputadora más rápida del mundo preparada para esta técnica de inteligencia artificial.
Las aplicaciones del reconocimiento de imágenes pueden ser útiles en campos tan cotidianos como los smartphones. Baidu mostró un software para reconocer las diferentes razas de perro a través de la cámara de un dispositivo móvil, pero también se puede usar para clasificar plantas o identificar monumentos. Sin embargo, reconocer imágenes es solo una faceta de la inteligencia artificial. Ahora que se ha sobrepasado el promedio humano, tal vez sea el momento de poner más énfasis en otros procesos, como la interpretación de vídeo.
Imágenes: Chesky y Vladimir Nenezic (Shutterstcok)