Ahora que estamos prácticamente acostumbrados a lidiar con los bots conversacionales o chatbots que emplean inteligencia artificial para resolver nuestros problemas, programar código, generar textos e imágenes o encontrar Información en Internet, llega el agente de IA o agente de inteligencia artificial. Un paso más hacia la integración de esta tecnología en nuestro día a día. Y que se diferencia del chatbot en su autonomía y mayor complejidad.
En IBM definen agente de inteligencia artificial como “un sistema o programa que es capaz de realizar tareas de forma autónoma en nombre de un usuario u otro sistema, diseñando su flujo de trabajo y utilizando las herramientas disponibles”. Es decir, que mientras que con ChatGPT, Gemini, Copilot o Claude, tienes que pedirles de forma clara y precisa qué tienen que hacer, tarea por tarea, en el caso de un agente de IA, pueden realizar tareas más complejas, e incluso decidir qué tareas hacer para cumplir el objetivo que le hemos marcado.
En la práctica, esto supone una evolución de la inteligencia artificial. A sus características habituales de procesar una gran cantidad de datos e Información y de imitar nuestra manera de escribir o hablar, se incorpora la toma de decisiones. Esto los hace más flexibles, eficientes y potencialmente más complejos que los asistentes actuales. Y abre muchas puertas a incorporar la inteligencia artificial a campos como la robótica o los asistentes virtuales de nueva generación.
Qué es un agente de IA
Volviendo a la definición de IBM, “los agentes de IA pueden abarcar una amplia gama de funcionalidades más allá del procesamiento del lenguaje natural, incluida la toma de decisiones, la resolución de problemas, la interacción con entornos externos y la ejecución de acciones”. Esto cambia mucho las cosas con respecto a los asistentes o bots de IA con los que interactuamos en la actualidad. Y convierte esa interacción en un proceso menos artesanal y más automatizado.
Los modelos de IA convencionales “producen sus respuestas basándose en los datos utilizados para entrenarlos y están limitados por sus conocimientos y su razonamiento”. Pero los agentes de IA van más allá. Pueden “obtener información actualizada, optimizar el flujo de trabajo y crear subtareas de forma autónoma para alcanzar objetivos complejos”. Y esto es posible, en gran parte, porque el agente de IA guarda interacciones pasadas en la memoria y puede planificar acciones futuras basadas en esa experiencia.
Microsoft lo explica así. “Un agente lleva el poder de la IA generativa un paso más allá, porque en lugar de solo ayudarte, los agentes pueden trabajar junto a ti o incluso en tu nombre. Los agentes pueden hacer una variedad de cosas, desde responder preguntas hasta tareas más complicadas o de varios pasos. Lo que los diferencia de un asistente personal es que pueden adaptarse para tener una experiencia particular”.
De esta manera, las características que diferencia un bot de IA con un agente de IA son su autonomía en la toma de decisiones, mayor capacidad de interacción con su entorno y el aprendizaje constante de manera autónoma. Esto convierte estas aplicaciones o software en intermediarios digitales. Intermediarios para desempeñar por nosotros determinadas tareas, ya que podemos personalizarlos y adaptarlos con mayor precisión a aquellas tareas que debamos desempeñar. Digitales o en combinación con elementos físicos, como maquinaria o dispositivos electrónicos.
Las partes de un agente de inteligencia artificial
Una manera de entender mejor el funcionamiento de un agente de inteligencia artificial es explicando sus partes o componentes. El agente de IA se compone del modelo de lenguaje o LLM que le hace aprender y desarrollar experiencia frente a las tareas que le asignamos. Para procesar las tareas, está su percepción o capacidad de procesar texto, imágenes, video o cualquier elemento físico o digital. Para adquirir experiencia y personalizar la evolución de la inteligencia artificial, es necesaria una memoria.
Y, finalmente, para que el asistente de IA se convierte en un agente de IA, necesitamos herramientas o acciones. Es decir, que a partir de sus componentes sea capaz de generar una respuesta en forma de acciones. Acciones que se traducen en interacciones con otras aplicaciones o servicios. Por ejemplo, hacer una búsqueda en Internet, recopilar una serie de datos, generar un artículo y enviártelo por correo electrónico. O buscar buenos precios en páginas de viajes, hacer una lista de las mejores opciones y añadir esas fechas en un calendario.
Para qué sirve un agente de IA
En la teoría, un agente de IA es capaz de automatizar tareas, tomar decisiones, interactuar con humanos y, finalmente, aprender y adaptarse. Combinando estas destrezas, los agentes de inteligencia artificial podrían desempeñar un variado abanico de tareas y acciones. En áreas tan variadas como la atención al cliente, la salud, las finanzas, la industria, la robótica o el transporte autónomo.
En la práctica, IBM propone varios “casos de uso” o tareas que un agente de IA podría realizar en un futuro no muy lejano. Para empezar, algo que ya viene ocurriendo desde hace años. La integración de bots en sitios web y aplicaciones para realizar tareas que ya hacen en la actualidad, como asistente virtual y soporte técnico. Y otras más elaboradas, como simulación de entrevistas o apoyo emocional.
La sanidad también puede beneficiarse de los agentes de IA, ya que pueden automatizar tareas burocráticas, por un lado, o resolver problemas más elaborados como planificar tratamientos a partir de los datos del paciente. Y si hablamos de interacción con el mundo físico, los agentes de inteligencia artificial pueden jugar un papel importante en la evolución y perfeccionamiento de la robótica multitarea para el ámbito industrial o doméstico. O de la conducción autónoma con automatización total. Grandes saltos cualitativos que podríamos disfrutar antes de lo esperado.
Del asistente virtual al agente de IA
Volviendo a Microsoft, explican que los agentes no son algo nuevo. Como tampoco lo eran los bots conversacionales o chatbots. La novedad está en implementar inteligencia artificial, o mejor dicho, modelos extensos de lenguaje (por sus siglas LLM en inglés). “Los agentes son como capas en la parte superior de los modelos de lenguaje que observan y recopilan información, proporcionan información al modelo y juntos generan un plan de acción y lo comunican al usuario, o incluso actúan por su cuenta, si está permitido”.
Así que si 2024 fue el año de los asistentes de IA, que seguirán desplegándose en toda clase de dispositivos, páginas web y aplicaciones, durante 2025 hablaremos cada vez más de agentes de IA. Su desarrollo y despliegue se hará más visible durante los próximos años. Algo que ya podemos ver. Con ejemplos para el gran público como Copilot y Microsoft 365, Gemini y su integración en todo el ecosistema de Google u OpenAI y su agente de IA Operator.