3 min de lectura

Filtración Revela 'Claude Mythos' de Anthropic: El Modelo de IA Más Poderoso Jamás Creado

Una filtración de datos expone que Anthropic está probando un nuevo tier de modelos llamado Capybara/Mythos con capacidades que superan dramáticamente a cualquier modelo anterior, incluyendo riesgos de ciberseguridad sin precedentes.

El Error Que Reveló el Secreto Mejor Guardado de Anthropic

Un error de configuración en el sistema de gestión de contenido de Anthropic dejó casi 3,000 documentos internos expuestos en una base de datos pública. Entre ellos: el borrador del anuncio de su modelo más poderoso hasta la fecha.

Fortune reportó la filtración el jueves, y Anthropic confirmó que está probando el modelo con clientes de acceso temprano.

Qué Es Claude Mythos / Capybara

Según los documentos filtrados, Anthropic está creando un nuevo tier de modelos por encima de Opus:

  • Capybara es el nombre del tier (más grande e inteligente que Opus)
  • Mythos es el nombre del modelo específico
  • Representa lo que Anthropic llama un “step change” en capacidades

“Comparado con nuestro mejor modelo anterior, Claude Opus 4.6, Capybara obtiene puntuaciones dramáticamente más altas en pruebas de código, razonamiento académico y ciberseguridad.”

El Problema: Riesgos de Ciberseguridad Sin Precedentes

Lo más revelador del borrador filtrado es la advertencia sobre seguridad:

  • El modelo es “actualmente muy superior a cualquier otro modelo de IA en capacidades cibernéticas”
  • Puede explotar vulnerabilidades de maneras que superan los esfuerzos de los defensores
  • Anthropic planea lanzarlo primero a organizaciones de ciberdefensa para darles ventaja

En otras palabras: este modelo podría ser usado para hackear a escala industrial.

La Estrategia de Lanzamiento

Anthropic planea un rollout inusualmente lento:

  1. Acceso temprano solo para clientes seleccionados
  2. Foco inicial en defensores de ciberseguridad
  3. El modelo es muy caro de servir
  4. Están trabajando en hacerlo más eficiente antes del lanzamiento general

Contexto: La Carrera de Modelos Peligrosos

Esto sigue el patrón de febrero cuando:

  • OpenAI lanzó GPT-5.3-Codex clasificándolo como “alta capacidad” para tareas de ciberseguridad
  • Anthropic lanzó Opus 4.6 que podía encontrar vulnerabilidades desconocidas en código de producción

Ambas empresas ahora compiten por quién puede crear el modelo más capaz en seguridad ofensiva… mientras simultáneamente advierten sobre los riesgos.

Lo Que Anthropic Dijo Oficialmente

“Estamos desarrollando un modelo de propósito general con avances significativos en razonamiento, código y ciberseguridad. Dada la fuerza de sus capacidades, estamos siendo deliberados sobre cómo lo lanzamos.”

Lo Que Esto Significa

  1. La carrera de IA está acelerando — Los modelos son cada vez más peligrosos
  2. El naming importa — ¿Mythos o Capybara? El debate interno sugiere preocupación por la imagen
  3. El precio será alto — Espera tarifas mucho mayores que Opus actual
  4. La ciberseguridad es el nuevo campo de batalla — Quien tenga el mejor modelo de ataque/defensa domina

El modelo más poderoso de Anthropic se filtró antes de estar listo. Y lo que reveló debería preocuparnos a todos.


¿Necesitas estrategia de IA para tu empresa? Hablemos.

Avatar de Jorge Razo
Jorge Razo Director @ KÖD