Imagen de Doom recreado con GameNGen

Una inteligencia artificial logra recrear el videojuego Doom de 1993 en tiempo real

Antes de que la inteligencia artificial se pusiera de moda entre el gran público, en el mundo de los videojuegos ya se hablaba de este concepto desde las primeras máquinas recreativas. En realidad, no era inteligencia artificial tal y como la conocemos ahora. Pero el concepto servía para explicar las mecánicas y comportamiento de los enemigos y personajes no jugables. Incluso hoy en día se sigue hablando de IA para mencionar si los personajes de un videojuego se comportan de manera natural o si hacen cosas raras. Pero algo completamente diferente es lo que sucede con GameNGen, un motor de videojuego que emplea un modelo neuronal, inteligencia artificial, para recrear un juego de ordenador.

Los motores de videojuegos, como Unity o Unreal Engine, se han convertido en piezas de software de gran complejidad. Y son capaces de recrear gráficos y de simular entornos, paisajes, climatología y asignar comportamientos y acciones a los personajes. Pero esto requiere de un mínimo de interacción por parte del desarrollador. Investigadores de Google y de la Universidad de Tel Aviv han ido varios pasos más allá, dotando su motor de videojuegos de la capacidad de recrear un videojuego tan popular como el Doom de 1993.

Si hasta ahora hemos visto cómo los modelos de IA actuales son capaces de escribir y hablar como nosotros, o de generar imágenes y videos con cierto realismo, GameNGen propone crear videojuegos en tiempo real basándose en un juego previo ya existente. Algo que abre las puertas a toda una nueva generación de juegos y que deja en pañales la generación procedural para la creación de niveles, basada en algoritmos. Con las implicaciones que esto tiene para el sector y sus profesionales.

Qué es GameNGen exactamente

Sus creadores lo presentan así. “Presentamos GameNGen, el primer motor de juego impulsado completamente por un modelo neuronal que permite la interacción en tiempo real con un entorno complejo a través de largas trayectorias con alta calidad. GameNGen puede simular interactivamente el clásico juego DOOM a más de 20 fotogramas por segundo en un solo TPU”. 

Para entendernos, un TPU es una unidad de procesamiento tensorial, por sus siglas en inglés. Wikipedia lo define como “circuito integrado de aplicación específica y acelerador de IA desarrollado por Google para el aprendizaje automático con redes neuronales artificiales”.

Es decir, que utilizando técnicas de generación de imágenes con IA basadas en Stable Diffusion, este motor de videojuegos es capaz no solo de generar imágenes prácticamente idénticas a los gráficos de Doom de 1993. También recrea las dinámicas del juego y su interactividad de movimientos y disparos del personaje y de los enemigos. Y aunque, por el momento, no es posible jugarlo, las imágenes mostradas por sus creadores son muy prometedoras.

Los responsables de GameNGen son Dani Valevski y Yaniv Leviathan, investigadores de Google Research, Moab Arar, de la Universidad de Tel Aviv, y Shlomi Fruchter, de Google DeepMind. Y, junto a la página web que muestra y explica brevemente en qué consiste este desarrollo, han publicado un paper científico más detallado sobre el funcionamiento de este ingenio basado en redes neuronales.

Como curiosidad, no es el primer proyecto de este tipo. En el documento técnico de GameNGen se citan World Models, de 2018 y GameGAN, de 2020. Y también hay que mencionar Genie, un proyecto de Google que también se centra en inteligencia artificial y generación de entornos interactivos. Por otro lado, no es la primera vez que los modelos de IA actuales se emplean para simular juegos. Cuando OpenAI presentó Sora, mostró imágenes emulando el popular Minecraft.

Entrenar una IA para crear videojuegos

Para que GameNGen haya recreado el juego Doom de 1993 han sido necesarias dos fases o etapas, tal y como explican sus creadores. Primero, un agente de aprendizaje de refuerzo, RL-agent en inglés, juega al juego original. Se trata de un software automatizado cuya misión es aprender a partir del material facilitado. En esta ocasión, el aprendizaje consistía en jugar a Doom, el clásico juego de 1993. Este software, el RL-agent, genera datos de entrenamiento para el modelo generativo de IA. 

En una segunda fase, el modelo de IA basado en Sable Diffusion 1.4, es entrenado a partir de los datos anteriores para producir nuevas imágenes inspiradas en el juego Doom. Y fue modificado para evitar los saltos e inconsistencias que solemos ver en algunos videos generados por IA. Lo que en videojuegos se conoce como glitch y que los autores del proyecto apodan auto-regressive drift. Y también para que cada frame tuviera conexión con el anterior y así generar imagen en movimiento.

La inteligencia artificial GameNGen

Por lo demás, este motor de videojuegos es capaz de generar 20 imágenes o frames por segundo. Que es lo que necesita el juego para dar sensación de movimiento. Y todo con una única TPU. Eso sí. En las pruebas para comprobar el resultado de la simulación, se han empleado fragmentos de video de entre 1,6 segundos y 3,2 segundos. Es decir, que todavía queda mucho por hacer hasta llegar a crear un juego entero de la nada. O, al menos, un nivel del juego original. Pero el solo hecho de ser capaces de recrear un juego de hace más de 30 años con un modelo a IA en tiempo real, ya es más que suficiente para considerarlo toda una proeza tecnológica.

Y más si tenemos en cuenta que este tipo de tecnología, llamada renderizado neuronal, no iba a estar disponible hasta dentro de cinco o diez años. Según vaticinaba el CEO de NVIDIA, Jensen Huang, en una entrevista esta pasada primavera. Así que los primeros pasos ya se han empezado a andar. Ahora falta escalar las capacidades de GameNGen para simular juegos enteros

El futuro del videojuego a muy largo plazo

Antes de llevarnos las manos a la cabeza, conviene tener presente que hace falta mucho trabajo por delante para llegar de lo logrado con GameNGen hasta poder ver un videojuego completamente generado por inteligencia artificial. Las pruebas realizadas constan de unos segundos. Como he mencionado antes, queda mucho para lograr un nivel entero o un juego completo. Precisamente, ahí está lo más difícil.

Los modelos de inteligencia artificial actuales se basan en replicar lo que han visto previamente. Texto, imagen, audio, video… Se basan en algo previo. De ahí que la noticia sea que una IA ha simulado el juego Doom de 1993. No ha creado un nuevo juego. En la fase actual, las inteligencias artificiales son capaces de generar contenido aparentemente nuevo. Pero siempre está muy emparentado con el contenido con que se entrenó esa IA. Lograr que una IA cree un nuevo juego, con sus dinámicas, reglas y una historia más o menos compleja, es algo que se asemeja mucho a la predicción de Jensen Huang. Tendremos que esperar cinco o diez años, si no más. 

Lo que sí está más cerca es la posibilidad de crear personajes, entornos, objetos y demás elementos virtuales a partir de unas peticiones de texto. Y que la IA genere el resto a partir de su catálogo de materiales de aprendizaje. O que mediante estas redes neuronales digitales sea posible generar entornos nuevos en tiempo real con más complejidad que los algoritmos empleados en los generadores de niveles procedurales y que tan buenos ratos hacen pasar a jugadores de todo el mundo.

RELACIONADOS