Filtración Revela 'Claude Mythos' de Anthropic: El Modelo de IA Más Poderoso Jamás Creado

El Error Que Reveló el Secreto Mejor Guardado de Anthropic

Un error de configuración en el sistema de gestión de contenido de Anthropic dejó casi 3,000 documentos internos expuestos en una base de datos pública. Entre ellos: el borrador del anuncio de su modelo más poderoso hasta la fecha.

Fortune reportó la filtración el jueves, y Anthropic confirmó que está probando el modelo con clientes de acceso temprano.

Qué Es Claude Mythos / Capybara

Según los documentos filtrados, Anthropic está creando un nuevo tier de modelos por encima de Opus:

Capybara es el nombre del tier (más grande e inteligente que Opus)
Mythos es el nombre del modelo específico
Representa lo que Anthropic llama un “step change” en capacidades

“Comparado con nuestro mejor modelo anterior, Claude Opus 4.6, Capybara obtiene puntuaciones dramáticamente más altas en pruebas de código, razonamiento académico y ciberseguridad.”

El Problema: Riesgos de Ciberseguridad Sin Precedentes

Lo más revelador del borrador filtrado es la advertencia sobre seguridad:

El modelo es “actualmente muy superior a cualquier otro modelo de IA en capacidades cibernéticas”
Puede explotar vulnerabilidades de maneras que superan los esfuerzos de los defensores
Anthropic planea lanzarlo primero a organizaciones de ciberdefensa para darles ventaja

En otras palabras: este modelo podría ser usado para hackear a escala industrial.

La Estrategia de Lanzamiento

Anthropic planea un rollout inusualmente lento:

Acceso temprano solo para clientes seleccionados
Foco inicial en defensores de ciberseguridad
El modelo es muy caro de servir
Están trabajando en hacerlo más eficiente antes del lanzamiento general

Contexto: La Carrera de Modelos Peligrosos

Esto sigue el patrón de febrero cuando:

OpenAI lanzó GPT-5.3-Codex clasificándolo como “alta capacidad” para tareas de ciberseguridad
Anthropic lanzó Opus 4.6 que podía encontrar vulnerabilidades desconocidas en código de producción

Ambas empresas ahora compiten por quién puede crear el modelo más capaz en seguridad ofensiva… mientras simultáneamente advierten sobre los riesgos.

Lo Que Anthropic Dijo Oficialmente

“Estamos desarrollando un modelo de propósito general con avances significativos en razonamiento, código y ciberseguridad. Dada la fuerza de sus capacidades, estamos siendo deliberados sobre cómo lo lanzamos.”

Lo Que Esto Significa

La carrera de IA está acelerando — Los modelos son cada vez más peligrosos
El naming importa — ¿Mythos o Capybara? El debate interno sugiere preocupación por la imagen
El precio será alto — Espera tarifas mucho mayores que Opus actual
La ciberseguridad es el nuevo campo de batalla — Quien tenga el mejor modelo de ataque/defensa domina

El modelo más poderoso de Anthropic se filtró antes de estar listo. Y lo que reveló debería preocuparnos a todos.

¿Necesitas estrategia de IA para tu empresa? Hablemos.

Jorge Razo Director @ KÖD

Filtración Revela 'Claude Mythos' de Anthropic: El Modelo de IA Más Poderoso Jamás Creado

El Error Que Reveló el Secreto Mejor Guardado de Anthropic

Qué Es Claude Mythos / Capybara

El Problema: Riesgos de Ciberseguridad Sin Precedentes

La Estrategia de Lanzamiento

Contexto: La Carrera de Modelos Peligrosos

Lo Que Anthropic Dijo Oficialmente

Lo Que Esto Significa

¿Te gustó este artículo?

Sigue leyendo

Anthropic lanza Claude Mythos Preview: el modelo de IA 'demasiado peligroso para el público'

Florida lanza investigación contra OpenAI días antes de su IPO de $1 trillion

Meta lanza Muse Spark: primer modelo del laboratorio de superinteligencia de $14 mil millones