Claude Fable 5: Anthropic lanza su modelo más potente al público con estrictos guardarraíles

Anthropic está llevando su modelo de IA más potente al público general por primera vez, pero lo hace con guardarraíles. Este martes, la firma de IA lanzó Claude Fable 5, la primera versión públicamente disponible de su modelo Mythos.

Anthropic afirma que Fable 5 sobresale en ingeniería de software, trabajo de conocimiento y visión, pero viene con límites de seguridad estrictos. En áreas de alto riesgo como ciberseguridad, biología, química y destilación, el modelo bloquea respuestas y recurre a Claude Opus 4.8.

“Internamente, ejecutamos un bug bounty externo que no produjo ningún jailbreak universal en más de 1,000 horas de prueba. Luego trabajamos con organizaciones externas de red-teaming que tampoco lograron encontrar jailbreaks universales.”

De Mythos a Fable 5

Lanzado como vista previa en abril, Mythos estuvo inicialmente limitado a un puñado de socios debido a preocupaciones de ciberseguridad. La semana pasada, Anthropic expandió el acceso a cientos de organizaciones en 15 países, nuevamente enfocándose en organizaciones que gestionan infraestructura crítica.

Ahora, una versión de esa tecnología está disponible para cualquier persona a través de la API de Claude y los planes Enterprise basados en consumo de Anthropic. El acceso en suscripciones se implementará por fases:

Hasta el 22 de junio: Fable 5 está incluido en los planes Pro, Max, Team y Enterprise (por asiento) sin costo adicional
23 de junio: Anthropic retirará Fable 5 de esos planes, requiriendo créditos de uso en adelante, con planes de restaurarlo como función estándar de suscripción lo antes posible

Anthropic también está desplegando una nueva versión de Mythos, llamada Mythos 5, para organizaciones que ya han sido aprobadas para acceder al modelo avanzado.

El costo del poder

El precio tanto para Fable 5 como para Mythos 5 es de $10 por millón de tokens de entrada y $50 por millón de tokens de salida, el doble del precio de Opus 4.8. Ese precio por sí solo podría servir como un disuasivo para el uso generalizado.

Muchas empresas se están volviendo críticas con los costos de IA después de ver las facturas llegar o agotar sus presupuestos anuales de IA anticipadamente. Los modelos avanzados como Opus 4.8 pueden exacerbar esos problemas, con habilidades de razonamiento avanzado que pueden dividir una sola solicitud en múltiples tareas.

Sin embargo, Anthropic espera que la demanda de Fable 5 sea muy alta y difícil de predecir. Y algunos, como la plataforma de recompensas de compras Rakuten, podrían pensar que el beneficio vale el precio:

“En el nivel de esfuerzo más alto, Fable reflexiona y valida su propio trabajo. Para nosotros, eso es lo que hace posibles las operaciones altamente autónomas — el pensamiento extra se paga solo.” — Rakuten

Guardarraíles y políticas de datos

Consciente de lo que un modelo de clase Mythos podría hacer en las manos equivocadas, Anthropic dice que probó sus clasificadores con intentos de jailbreak antes de lanzar Fable 5.

Dicho esto, aún podrían existir ataques novedosos. Como resultado, con el lanzamiento de Fable 5 y Mythos 5, Anthropic exigirá una retención de 30 días en todo el tráfico, incluso si las empresas tenían acuerdos de retención cero previamente. Anthropic dice que no usará los datos para entrenamiento, solo para “defenderse contra ataques complejos y novedosos, incluidos nuevos jailbreaks” e “identificar y reducir falsos positivos”.

Esta política podría establecer un precedente en la industria donde el acceso a modelos cada vez más poderosos viene con políticas obligatorias de retención de datos enmarcadas como una medida de seguridad.

Rendimiento en pruebas

En pruebas de terceros, la empresa de análisis Hex declaró que Fable fue el primero en obtener un 90% en su benchmark de análisis de tareas analíticas complejas y de larga duración. “En las preguntas más difíciles, muestra un buen juicio y atención a los matices”, dijo Hex.

La plataforma de vibe-coding Base44 señaló que Fable es mejor en “crear aplicaciones completas de una sola vez” y tiene un excelente tool-calling. Genspark, la plataforma de agentes y espacio de trabajo impulsado por IA, dijo que Fable superó a todos los demás modelos en sus evaluaciones y se desempeñó significativamente mejor en tareas como diseño de UI y programación de juegos.

Para los casos en que Fable tiene que diferir a Opus 4.8, los datos iniciales muestran que al menos el 95% de las sesiones de Fable se ejecutan completamente con las respuestas del modelo.

El lanzamiento de Fable 5 llega mientras Anthropic se prepara para ingresar a los mercados públicos, junto a OpenAI y SpaceX de Elon Musk. También sigue al llamado de la firma instando a los principales laboratorios de IA globales a establecer un freno coordinado en el desarrollo de IA de frontera, advirtiendo que los sistemas están avanzando tan rápidamente que podrían lograr una auto-mejora recursiva (RSI) — mejorándose autónomamente sin intervención humana.

Claude Fable 5: Anthropic lanza su modelo más potente al público con estrictos guardarraíles

De Mythos a Fable 5

El costo del poder

Guardarraíles y políticas de datos

Rendimiento en pruebas

En resumen

¿Te gustó este artículo?