Claude Fable 5: el nuevo modelo de Anthropic con freno integrado

El 9 de junio de 2026, Anthropic publicó Claude Fable 5. Es el modelo de IA más potente que la empresa ha puesto a disposición del público. Supera las marcas de prácticamente todo lo que había antes (benchmarks). Y viene con un mecanismo que lo frena a propósito cuando detecta que la pregunta cruza una línea.

Ese detalle lo cambia todo y es lo que mas ruido esta haciendo. Es la primera vez que un laboratorio reconoce abiertamente que su propio modelo requiere un sistema de contención para salir al mercado. Y lo explica.

El lanzamiento incluye en realidad dos modelos. Claude Fable 5, disponible para cualquiera. Y Claude Mythos 5, con las mismas capacidades base pero con algunas restricciones desactivadas, reservado para un grupo reducido de ciberdefensores e infraestructura crítica dentro del Proyecto Glasswing. Los dos son el mismo modelo por debajo. Lo que los separa es lo que tienen bloqueado.

¿hasta dónde habíamos llegado?

Los modelos de lenguaje llevan años mejorando, pero hasta este año tenían dos límites claros:

El primero era la autonomía en tareas largas. En sesiones que se extendían durante horas, o que implicaban muchos pasos encadenados, los modelos perdían el hilo o acumulaban errores. Su memoria se desorganizaba y empezaban sus típicos delirios, podían asistir, pero difícilmente completar proyectos complejos de principio a fin sin supervisión constante.

El segundo era la profundidad científica real. Podían sintetizar información y buscar referencias, pero no generaban hipótesis novedosas ni ejecutaban experimentos computacionales de forma independiente.

El paso previo fue Claude Mythos Preview, lanzado en abril de 2026. Ese modelo ya superaba esos límites, pero Anthropic decidió no ponerlo a disposición general: sus capacidades en ciberseguridad eran demasiado potentes. Fable 5 es el intento de Anthropic de hacer pública esa potencia con salvaguardas que, en teoría, evitan los usos más peligrosos.

Lo que puede hacer Fable 5 que los anteriores no podían

La prueba más concreta viene de Stripe. Durante las pruebas previas al lanzamiento, Fable 5 completó en un día una migración en una base de código Ruby de 50 millones de líneas. La misma tarea le habría llevado a un equipo completo más de dos meses, no es una mejora marginal.

En análisis financiero, el IMC lo evaluó en tareas de trading y pasó en prácticamente todas las categorías: búsqueda de datos, razonamiento conceptual, análisis de causa raíz y cálculo de valor esperado. Hebbia, que evalúa modelos en análisis financiero de nivel senior, lo situó por encima de todo lo que había testado hasta ahora.

En visión también hay un salto real. Fable 5 puede reconstruir el código fuente de una aplicación web a partir de capturas de pantalla. Puede mantener el hilo durante millones de tokens en tareas largas, tomando notas propias para mejorar sus salidas. Los modelos anteriores necesitaban una infraestructura auxiliar para jugar al Pokémon Rojo Fuego. Fable 5 lo completó solo con capturas de pantalla en bruto, sin mapas ni herramientas de apoyo.

En investigación científica, ya con Mythos 5 (la versión sin restricciones), los resultados son más llamativos. En diseño de proteínas, los expertos internos de Anthropic aceleraron el proceso farmacológico unas diez veces. De 14 objetivos proteicos del estudio, 9 produjeron candidatos sólidos para desarrollo de fármacos. En biología molecular, el modelo generó hipótesis novedosas que los científicos de Anthropic prefirieron sobre las de modelos anteriores en el 80% de las comparaciones ciegas. Una de esas hipótesis fue corroborada independientemente por un laboratorio externo que trabajaba en paralelo en el mismo problema.

¿Cómo se compara con sus competidores actuales?

A mediados de 2026, los tres modelos que dominan el mercado frontier son Fable 5, GPT-5.5 de OpenAI y Gemini 3.1 Pro de Google.

En las pruebas de programación autónoma, Fable 5 claramente va por delante, esto no es nada nuevo ya que los modelos de Claude tienen cierta reputacion entre los programadores. SWE-Bench Pro es un test estándar del sector donde los modelos tienen que resolver bugs reales de proyectos de software: Fable 5 resuelve el 80% frente al 58,6% de GPT-5.5 y el 54,2% de Gemini. Cuando las tareas son más difíciles (código de producción de alta complejidad) la distancia se agranda todavía más: Fable 5 resuelve casi el triple que GPT-5.5.

El precio es el otro factor. Fable 5 cuesta 10 dólares por millón de tokens de entrada y 50 por millón de salida. GPT-5.5 sale por la mitad y sigue siendo competitivo en conocimiento general. Gemini 3.1 Pro es aún más barato y más rápido para volúmenes altos.

Hay un matiz que vale la pena mencionar: algunas filas de la tabla comparativa publicada por Anthropic muestran los resultados de Mythos 5, no de Fable 5. En las áreas donde los clasificadores de seguridad se activan (ciberseguridad y biología avanzada) el rendimiento de Fable 5 cae al nivel de Opus 4.8. Es decir: el modelo más potente disponible al público rinde deliberadamente peor en las áreas donde más podría hacer daño.

El debate de los frenos

Lo que más llama la atención no son los benchmarks. Es que se haya diseñado un modelo con un sistema de frenado incorporado y luego sus creadores hayan explicado, sin esconderlo, que ese freno a veces actúa donde no debería. La empresa estima que ocurre en menos del 5% de las sesiones, los primeros usuarios reportan que se activa con más frecuencia de lo esperado en consultas que consideran inofensivas.

Eso plantea preguntas prácticas para quien quiera integrarlo en producción: ¿se puede confiar en que el modelo se comporte de forma consistente cuando alguien lo integra en un sistema real? Y si el propio creador del modelo describe sus salvaguardas como demasiado conservadoras en el momento del lanzamiento, ¿qué dice eso del estado actual de la industria?

Lo que sí está claro es que Anthropic lleva cierta delantera técnica. Lo que no está claro es si el modelo de acceso que han elegido va a mantener esa ventaja o va a empujar a los usuarios más intensivos hacia los competidores, que tardarán poco en responder.

Si te ha gustado este artículo y quieres recibir más contenido sobre innovación y tecnología directamente en tu correo, suscríbete a nuestra newsletter y mantente siempre actualizado. No somos de los que llenan tu bandeja, solo compartimos los lunes.

¡Únete aquí!

Claude Fable 5: el modelo de IA más potente disponible al público y el primero que admite ser demasiado peligroso para usarlo sin restricciones

¿hasta dónde habíamos llegado?

Lo que puede hacer Fable 5 que los anteriores no podían

¿Cómo se compara con sus competidores actuales?

El debate de los frenos

Sobre el autor

Daniel Ruiz-Gopegui

RELACIONADOS

Plan Noetra: qué es y por qué Japón quiere 10 millones de robots con IA para 2040

El discípulo quiere comprar al maestro: la opa de Stripe por PayPal

¿Puede una IA fugarse de su entorno de pruebas? El día que GPT-5.6 hackeó Hugging Face

El programa Cervera y 70 millones para no perder el tren tecnológico europeo