El éxito del bot jugador de póker podría suponer un gran paso de la IA en la búsqueda de la automatización de procesos como las negociaciones, la detección de fraudes o los coches autónomos.
Un bot jugador de póker llamado Pluribus ha ganado una partida jugando contra seis jugadores profesionales de Texas hold’ em, la versión estándar y más popular del juego. Se trata de la primera ocasión en la que un dispositivo de Inteligencia Artificial vence a jugadores humanos de élite en una partida con más de dos jugadores.
Pluribus es una actualización de Libratus, un bot creado por el mismo equipo y que fue capaz de vencer a dos jugadores profesionales en 2017. Este nuevo modelo requiere mucha menos potencia de computación y ha demostrado tener capacidad para jugar más de 10.000 manos y vencer a 15 jugadores a lo largo de 12 días.
Imbatible en partidas de dos jugadores
Las numerosas pruebas han demostrado que la IA es imbatible en partidas de dos jugadores. Los bots han conseguido perfeccionar el algoritmo y controlar la teoría del juego hasta definir la mejor estrategia posible para vencer en cada escenario que se plantee.
El gran reto que se le presenta a Pluribus es enfrentarse a partidas de más de seis jugadores en las que las opciones son mucho más numerosas y la teoría es menos útil. Solventar las complejidades de las partidas de póker jugador serviría para establecer las bases de la IA del futuro.
Busca la mejor estrategia que los humanos no utilizan
El algoritmo de Libratus consistía tradicionalmente en buscar el final de la partida antes de decidir la siguiente acción. El póker implica la dificultad de razonar con información oculta y las partidas multijugador suman la problemática de tener que tomar una decisión en cualquier momento sobre un abanico de posibilidades mucho mayor. La clave del éxito de Pluribus reside en el desarrollo de un método capaz de tomar buenas decisiones tomando como referencia únicamente un par de movimientos adelante y no al final de la partida.
Pluribus ha logrado perfeccionar su aprendizaje después de jugar millones de manos de póker contra sí mismo. El algoritmo revisa cada acción tomada en busca de mejores alternativas para ganar más dinero en futuras partidas. Así, en cada momento clave de la partida la IA es capaz de analizar la situación, determinar cómo se va a desarrollar la con varios movimientos de antelación y establecer la estrategia que los humanos tienden a no utilizar.