AlphaZero

Cómo AlphaZero aprende a ser la mejor en juegos de tablero

El programa de IA AlphaZero aprende por sí solo a ganar a las mejores máquinas en ajedrez, go y shogi.

La proeza técnica de AlphaZero tiene dos componentes relevantes en el campo de la inteligencia artificial. El programa de DeepMind, subsidiaria de Alphabet, ha logrado dominar varios juegos a la vez. Pero es que también ha conseguido aprender a hacerlo por sí solo.

La superación de los humanos ha sido la constante que ha movido la invención y el desarrollo de las máquinas. Antes se buscaba la fuerza física, la repetición de tareas. Pero ahora la inteligencia es el principal reto a la hora de diseñar una máquina. Y una buena forma de probar estas facultades cognitivas es enfrentando a los programas a juegos de tablero complejos. Aquí se necesita combinar lógica, intuición y estrategia para ganar al contrincante.

Hace ya más de 20 años que Deep Blue ganó a Gary Kaspárov en un hito sin precedentes. Y solo en 2016 se desarrolló una inteligencia artificial que ganara al mejor jugador del mundo de go. Esto ha sido un nuevo hito por el componente creativo de vesta disciplina. La máquina de IBM jugaba al ajedrez mediante un cálculo bruto de posibilidades. Sin embargo, este método no servía para el go, que requiere de un alto nivel de intuición.

DeepMind logró superar esta barrera. Y el paso que ha confirmado ahora es un nuevo salto hacia delante. La compañía ya había mostrado que su software era capaz de vencer al go, al ajedrez y al shogi (un tipo de ajedrez japonés). Pero ahora el mérito de la plataforma AlphaZero se ha visto reconocido por la revista Science.

Un campeón para todos los juegos

AlphaZero ha vencido a las principales máquinas preparadas para ser las mejores en cada juego individualmente. Los programas Stockfish y Elmo, ambos considerados los más avanzados en el ajedrez y el Shogi, respectivamente, han sido los principales rivales a vencer. En el go, AlphaZero se ha enfrentado a su antecesora AlphaGo, quien ganara al mejor jugador humano.

Los especialistas aseguran que AlphaZero no solo ha aprendido a jugar a estas tres disciplinas. (Sus rivales, en cambio, han sido entrenados específicamente para un solo juego). La plataforma ha mostrado un estilo de juego genuino. Lo suyo no ha sido solo evitar cometer errores y elevar así el nivel de la partida. El programa habría demostrado lo que en una persona llamaríamos intuición.

AlphaZero

La inteligencia artificial de DeepMind no necesitaba evaluar un número tan alto de posibilidades antes de mover ficha. Para tomar una decisión, le bastaba hacer un cálculo masivo –muy superior en opciones al de un humano– pero considerablemente más reducido que el de sus rivales. Su sistema prima un análisis más profundo frente a un repaso exhaustivo de la situación.

El resultado es que las redes neuronales de las que está compuesto AlphaZero se han comportado como un ser humano en estado de gracia. Más aun, desde luego, pero con la potencia de cálculo que permiten estos sistemas. El hecho de que haya aprendido por sí sola los tres juegos es otro de los aspectos notables que nos acercan a una –aún muy lejana– inteligencia artificial general.

Imágenes: kimfaires, AlphaZero

Sobre el autor

RELACIONADOS

GPTs Custom

Cómo hacer GPTs Custom

Hace unos meses, OpenAI presentó una nueva función para ChatGPT, el popular chatbot de la compañía que funciona gracias a GPT-4, su modelo de...