Claude 3.5 Sonnet: la IA que adelanta a GPT 4o y Gemini 1.5 Pro

La inteligencia artificial está en todas partes. Prácticamente, todas las empresas del sector tecnológico están implicadas, directa o indirectamente, en algún modelo de inteligencia artificial generativa. Y la lucha por ser el primero es incansable. En ella batallan Google, OpenAI, Meta y Anthropic, principalmente, aunque recientemente se unió Apple. Sea como fuere, en esta competición, sacar las mejores notas es importante, y Claude 3.5 Sonnet lo ha logrado. Al menos, por ahora.

En esta competición por ver quién tiene la mejor inteligencia artificial se utilizan varios baremos. Por un lado, la velocidad de procesamiento y respuesta. Por otro, el coste de uso de la IA. Aunque hay modelos adaptados para trabajar en local, los modelos de IA más complejos necesitan complejos mecanismos formados por redes de servidores que solo los más grandes del sector pueden permitirse. Y esto tiene un coste. Y un impacto en consumo energético.

Pero, claro está, la cara visible de la inteligencia artificial está en lo que puede hacer por nosotros. Ya estamos acostumbrados a sus cualidades en cuestión de traducir, procesar, resumir o redactar contenido escrito. Y, poco a poco, vamos viendo mejoras en el procesamiento de audio y, especialmente, en procesar imágenes, estáticas y en movimiento. En esto último destaca Claude 3.5 Sonnet, el modelo más actual de la inteligencia artificial de Anthropic.

Qué es Claude 3.5 Sonnet

Por si todavía no conoces este modelo de inteligencia artificial, Claude es un modelo de lenguaje largo desarrollado por Anthropic. Se lanzó por primera vez en marzo del año pasado. Y promete ser un gran rival de GPT y Gemini, las IA de OpenAI y Google, respectivamente. Y también, aunque en menor medida, de Apple Intelligence. Por su parte, Anthropic es una empresa especializada en inteligencia artificial, creada por antiguos empleados de OpenAI. Y cuenta con la financiación de grandes como Amazon o Google.

Como ocurre con los demás modelos de IA, Claude tiene tres versiones. De menos a más compleja, y por tanto, que consume más o menos recursos. De menor a mayor, Claude se divide en Haiku, Sonnet y Opus. Los tres van ya por la versión 3. Pero el modelo intermedio, va más adelantado. A finales de junio, Anthropic dio a conocer Claude 3.5 Sonnet.

Claude 3.5 Sonnet supera a Claude 3 Opus en inteligencia, según las pruebas estándares, lo que es un gran logro, teniendo en cuenta que Opus es la versión más compleja y potente de la familia Claude. Al mismo tiempo, Claude 3.5 Sonnet tiene el mismo coste de uso que su versión anterior, Claude 3 Sonnet. Es decir, mejora en rendimiento y potencia siendo más eficiente.

Según sus creadores, las mejoras “son más notables para las tareas que requieren un razonamiento visual, como la interpretación de tablas y gráficos”. “También puede transcribir con precisión el texto de imágenes imperfectas, una capacidad central para el comercio minorista, la logística y los servicios financieros, donde la IA puede obtener más información de una imagen, gráfico o ilustración que solo del texto”.

Y no suficientemente satisfechos con ello, el futuro de Claude pasa por “mejorar la curva de compensación entre inteligencia, velocidad y costo cada pocos meses”. A lo largo del año, el resto de la familia se actualizará a la versión 3.5. Es decir, Haiku y Opus. Además, tienen pensado introducir nuevas funciones para el uso práctico de esta IA, como recordar las preferencias e interacciones previas del usuario.

El primero de la clase, superando todos los tests

Es normal que Anthropic hable bien de su creación, Claude 3.5 Sonnet. Pero para saber si es cierto o no, existen tests que emplean todos los contendientes en la carrera por obtener la mejor IA. La lista es muy larga, y cada uno está especializado en distintas tareas, como razonamiento, escribir o leer código de programación, matemáticas, entender un texto, resolver problemas matemáticos, razonamiento a partir de un estímulo visual, responder a preguntas…

Los tests dan como ganador Claude 3.5 Sonnet

En su anuncio oficial, Claude 3.5 Sonnet sale ganador en todos estos tests, convirtiéndose en el primero de una clase en la que aparecen GPT-4o de OpenAI, Gemini 1.5 Pro de Google y Llama-400b de Meta (antes Facebook). “Establece nuevos puntos de referencia de la industria para el razonamiento a nivel de posgrado (GPQA), el conocimiento a nivel de pregrado (MMLU) y el dominio de la codificación (HumanEval). Muestra una marcada mejora en la comprensión de los matices, el humor y las instrucciones complejas, y es excepcional en la escritura de contenido de alta calidad con un tono natural y cercano”.

En la práctica, esto se traduce en que Claude 3.5 Sonnet “puede escribir, editar y ejecutar código de forma independiente con capacidades sofisticadas de razonamiento y solución de problemas. Maneja las traducciones de código con facilidad, lo que lo hace particularmente eficaz para actualizar aplicaciones heredadas y migrar bases de código”.

Y, como vimos antes, como novedad, esta nueva versión de Claude es capaz de traducir e interpretar imágenes, gráficos e ilustraciones. Hasta el punto de extraer el texto mostrado en una imagen para resolver un problema matemático, traducir una frase o responder a una pregunta.

Cómo probar tú mismo Claude 3.5 Sonnet

La mejor manera de saber si este modelo de IA se ajusta a tus necesidades es probándolo tú mismo. En este sentido, Anthropic ofrece de manera gratuita Claude 3.5 Sonnet a través de su página web y de su aplicación para iOS. Es decir, Claude.ai y Claude para iOS. En ambos casos necesitarás registrarte. Aunque el proceso es rápido, gratuito y puedes usar tus credenciales de Google en vez de indicar un correo electrónico y una contraseña.

Por otra parte, Claude 3.5 Sonnet ya viene integrada en la API de Anthropic, necesaria para programar aplicaciones y servicios que utilicen esta IA. También está disponible en Amazon Bedrock y en Google Cloud’s Vertex AI. Aunque en estos tres casos, su uso tiene un coste de 3 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida, con una ventana de contexto de 200 000 tokens.

Otra novedad relacionada con el uso de Claude se llama Artifacts o artefactos. Si a finales de mayo Anthropic anunciaba que Claude podía “trabajar con herramientas” de terceros y APIs, ahora incorpora otra manera más de personalizar las respuestas de Claude. Según sus creadores, “cuando un usuario le pide a Claude que genere contenido como fragmentos de código, documentos de texto o diseños de sitios web, estos artefactos aparecen en una ventana dedicada junto a su conversación. Esto crea un espacio de trabajo dinámico donde pueden ver, editar y aprovechar las creaciones de Claude en tiempo real, integrando a la perfección el contenido generado por la IA en sus proyectos y flujos de trabajo”.