Computer Use de Claude

Qué es computer use, la nueva función de la IA Claude

Cuando muchos pensamos en inteligencia artificial, nos vienen a la mente imágenes de ciencia ficción como automóviles autónomos, robots o casas inteligentes. Es decir, que el propósito final de la IA debería ser hacernos la vida más fácil, encargándose de tareas físicas para las que no estamos preparados o que no nos apetece realizar. Sin embargo, la IA generativa que estamos viendo en los últimos años está más centrada en procesar datos para responder preguntas, generar textos e imágenes o imitar la voz humana. Pero, poco a poco, el desarrollo de inteligencia artificial da grandes saltos como computer use, de Anthropic.

Para quienes todavía no conocen Anthropic, no está de más recordar que se trata de una startup especializada en inteligencia artificial. Su modelo de IA generativa, Claude, está a la par con GPT de OpenAI, Gemini de Google o Llama de Meta. Entre sus fundadores y empleados hay antiguos trabajadores de OpenAI. Y aunque su objetivo es similar, sus proyectos tienen algunas diferencias. Recientemente, dieron a conocer Artifacts, una manera más visual de interaccionar con IA generativa. Y ahora nos sorprenden con computer use. Una característica de su IA que ofrece infinidad de posibilidades.

En palabras de Anthropic, computer use consiste en que le permite a Claude “usar las computadoras como lo hacen las personas, mirando una pantalla, moviendo un cursor, haciendo clic en botones y escribiendo texto”. Es decir, que su IA es capaz de hacer de piloto automático y automatizar tareas o acciones que antes solo estaban al alcance de un ser humano. Y aunque todavía no conocemos todas las posibilidades que ofrece, va más allá de una macro, un script u otras herramientas más rudimentarias para automatizar movimientos del ratón o abrir aplicaciones sin nuestra intervención. 

Computer use, Claude sabe usar tu PC

En el anuncio oficial de Anthropic, se dice que computer use, uso de computadora en castellano, es una función recién introducida en la API de Claude, su modelo de inteligencia artificial. De manera que los desarrolladores de aplicaciones y herramientas informáticas ya pueden probarlo. Aunque se encuentra en una fase de prueba que puede dar pie a errores. De manera que quienes lo prueben, podrán informar a Anthropic de esos errores y contribuir a su mejora.

Con todo, esta función tan prometedora ya ha sido probada por empresas como Asana, Canva, Cognition, DoorDash, Replit o The Browser Company, conocidas por sus aplicaciones, productos y servicios. Una pequeña muestra de lo mucho que podrá hacer Claude si aprende a utilizar un ordenador o un dispositivo electrónico cualquiera. 

Con Computer Use, Claude es capaz de abrir aplicaciones y mover el cursor

Y como dicen en Anthropic, se trata de un gran cambio, ya que a diferencia de lo que hacían las IA hasta ahora, no se trata de aprender a hacer una tarea específica. “Le estamos enseñando habilidades informáticas generales, lo que le permite utilizar una amplia gama de herramientas estándar y programas de software diseñados para las personas”.

La tarea de los desarrolladores de aplicaciones es traducir órdenes e instrucciones a comandos de ordenador. El ejemplo que ponen consiste en pasar de “usar datos de mi computadora y en línea para completar este formulario” a algo como “revisar una hoja de cálculo, mover el cursor para abrir un navegador web, navegar por las páginas web relevantes” o “completar un formulario con los datos de esas páginas”.

Y para evitar que computer use se utilice para fines como publicidad no deseada, desinformación o fraude, en Anthropic están siendo cautos. “Hemos desarrollado nuevos clasificadores que pueden identificar cuándo se está utilizando el uso de la computadora y si se está produciendo” una utilización no deseada o que roce la ilegalidad. 

Asistentes de IA más útiles todavía

“Permitir que las IA interactúen directamente con el software informático de la misma manera que lo hacen las personas desbloqueará una amplia gama de aplicaciones que simplemente no son posibles para la generación actual de asistentes de IA”. Precisamente, una de las críticas que se le hacen a las inteligencias artificiales generativas es que se limitan a determinadas tareas. Y que su área de acción se centra en procesar datos y responder a preguntas. Tareas más complejas como tomar el control de tu ordenador sería un gran salto cualitativo, ya que permitiría realmente ofrecer servicios propios de un asistente.

Ejemplo de lo que puede hacer Claude con computer use

Para hacer esto posible, los responsables de Claude han partido de sus habilidades actuales para ir más allá de lo que puede hacer hasta ahora. En concreto, sus capacidades para ver e interpretar imágenes. “Claude mira las capturas de pantalla de lo que es visible para el usuario, luego cuenta cuántos píxeles vertical u horizontalmente necesita para mover un cursor para hacer clic en el lugar correcto”. 

Todavía está por ver cómo será la interacción entre usuario e inteligencia artificial una vez esta función computer use esté disponible para todo el mundo. Lo ideal será simplificar todo lo posible el proceso entre pedirle algo a Claude y que la IA entienda lo que le pedimos. Ahí entra el trabajo de los desarrolladores. De momento, desde Anthropic recomiendan probar esta función en una máquina virtual. En este documento técnico está toda la información sobre cómo probarlo.

El futuro de la IA que controla ordenadores 

Lo que nos propone Anthropic con computer use, o uso de computadora, es una evolución de la inteligencia artificial. Hacia procesos más complejos que la hagan más útil todavía. Más pronto que tarde podremos darle órdenes escritas o por voz. Y pedirle que abra un documento, consulte información en una hoja de cálculo o que realice tareas más elaboradas en nuestro ordenador o teléfono móvil sin que tengamos que mover un dedo.

Y todo apunta a que Claude no será la única IA capaz de ello. Google también anunció recientemente el desarrollo de Jarvis, una herramienta basada en inteligencia artificial que podrá controlar un ordenador y automatizar tareas en Google Chrome. Y OpenAI, lleva desde febrero de 2024 trabajando oficialmente en algo similar bajo el nombre de Tools, Herramientas en inglés. Por su parte, tanto Microsoft como Meta y Apple también enfocan sus esfuerzos en inteligencia artificial en lograr que sus modelos de IA puedan realizar este tipo de tareas. Un salto evolutivo en el desarrollo de inteligencia artificial que dará grandes frutos en los próximos meses y años.

RELACIONADOS