Solemos decir que la Inteligencia Artificial es como un supercerebro humano, pero todavía le falta mucho para imitarlo. Se ha convertido en una poderosa herramienta que agiliza la investigación, los avances tecnológicos y el trabajo. Los sistemas de IA puede procesar mucha información rápidamente, responder preguntas y generar textos, imágenes y vídeos, pero no «piensan» como tal.
La Inteligencia Artificial simula el aprendizaje humano pero está muy lejos de tener sentido común o intuir. Yann LeCun, responsable de la división de IA de Meta, afirmó en una entrevista con Financial Times que los LLM (Modelos de Lenguaje de Gran Tamaño, como ChatGPT) «tienen un entendimiento limitado de la lógica, no entienden el mundo físico».
Los LLM actúan en función de los datos de los que se alimentan, pero sus respuestas están limitadas a esa información. Los World Models se alimentarían, por así decirlo, del mundo real.
Qué son los World Models
Los World Models son «modelos de IA generativa (o sea, la que genera contenido nuevo a partir de datos existentes) que entienden las dinámicas del mundo real, incluidas sus propiedades físicas y espaciales», resumen desde NVIDIA, una de las mayores empresas de software y computación de inteligencia artificial.
Los World Models están diseñados para comprender, representar y predecir el comportamiento de entornos complejos. Su objetivo es crear una representación interna del mundo que le permita razonar, planificar y tomar decisiones de manera eficiente, especialmente en entornos dinámicos e inciertos.
La startup de IA Runway señala algunas de las limitaciones a la hora de desarrollar esta tecnología. Como humanos, sabemos que el mundo es complejo y diverso, y que solemos movernos en la incertidumbre. Uno de los retos es precisamente trasladar la percepción, intuición y adaptación humana a las máquinas.
«Estos modelos necesitarán generar mapas coherentes del entorno, y la habilidad de navegar e interactuar con ellos. Necesitan capturar no solo las dinámicas del mundo, sino las de sus habitantes, lo que implica la construcción de modelos realistas de comportamiento humano«, indica Runway.
Bocetando el concepto World Models
Los World Models no son de este año ni del pasado. Expertos en Inteligencia Artificial llevan unos años dándole vueltas al concepto. No obstante, el tema promete ganar relevancia este año debido a, por un lado, la presentación de Cosmos de NVIDIA en el reciente CES 2025 (la feria de tecnología de consumo más importante del mundo) y, por otro lado, por las múltiples aplicaciones que los World Models puedan tener en los vídeos generados con IA o en los vehículos autónomos, asuntos muy candentes actualmente.
En 2018, los investigadores en IA, David Ha y Jürgen Schmidhuber, publicaron un ensayo en el que exploraban la construcción de World Models. Esta IA busca replicar el funcionamiento de nuestro modelo mental: «Los humanos desarrollan un modelo mental del mundo basándose en lo que son capaces de percibir con sus limitados sentidos. Las decisiones y acciones que tomamos están basadas en este modelo mental».
Para ilustrar este concepto, los investigadores ponen el ejemplo de un bateador. El jugador golpea en mucho menos tiempo del que las señales visuales de la pelota tardan en llegar al cerebro. Lo hace porque instintivamente sabe predecir adónde irá la pelota porque sus músculos reaccionan en el momento exacto en línea con su modelo mental interno. El bateador actúa y predice el futuro sin necesidad de plantear todos los escenarios posibles para elaborar un plan.
Primeros acercamientos
En 2019, la empresa de inteligencia artificial DeepMind, parte de Google, desarrolló MuZero. Es una IA capaz de competir en juegos como el ajedrez sin conocer las reglas por lo que se ve obligada a predecir las dinámicas del juego. Esto supone un salto capacidades de los algoritmos de aprendizaje por refuerzo. El aprendizaje por refuerzo se refiere a algoritmos que aprenden a partir de la prueba y error mediante recompensas.
Uno de los ejemplos más concretos de esta tecnología es Sora, la IA de OpenAI de creación de vídeos. Este sistema podría considerarse un World Model porque debe comprender las leyes físicas y el comportamiento de los objetos.
¿Cómo se podría aplicar World Models?
Como se mencionó anteriormente, la empresa de software NVIDIA anunció en el CES 2025 que lanzará una familia de World Models con simulaciones físicas. Estas simulaciones se utilizan en diversos campos, como la conducción autónoma y la robótica.
Para la conducción autónoma, los World Models podrían entrenar a los vehículos de manera más precisa para que entiendan mejor su entorno lleno de coches, peatones y objetos. Además, les permitiría crear escenarios que respondan mejor a los obstáculos del mundo real.
En el ámbito de la robótica, el uso de World Models podría simular y verificar el comportamiento de los sistemas robóticos en diferentes ambientes y situaciones más realistas. De esta manera, se garantiza un desempeño más seguro antes de su despliegue comercial.
Una vez más, la tecnología busca romper fronteras y la IA aspira a mayor autonomía y a parecerse más a nuestro cerebro. Estos dos últimos años, la Inteligencia Artificial ha estado en boca de todos y continuará siendo protagonista en 2025.
Imagen de cabecera: diseñado por Freepik.