Anthropic filtró sin querer 'Claude Mythos': el modelo de IA que aterró a las bolsas de ciberseguridad
Un error de configuración en el CMS de Anthropic expuso ~3,000 assets internos y reveló su modelo más poderoso: Capybara, por encima de Opus, con capacidades de ciberseguridad que hacen temblar a CrowdStrike y SentinelOne.
La ironía no tiene límite. La empresa que entrena modelos de IA para no cometer errores de seguridad acaba de cometer uno de los errores de seguridad más espectaculares de 2026: dejó casi 3,000 assets internos expuestos públicamente en su propio CMS, incluyendo el borrador de anuncio de su modelo más poderoso hasta la fecha. El nombre: Claude Mythos. El nombre en clave del producto: Capybara. Y lo que dice de él asustó tanto al mercado que CrowdStrike, Palo Alto Networks y SentinelOne se desplomaron en bolsa.
Cómo pasó el leak: un default mal configurado
Según el reporte exclusivo de Fortune del 26 de marzo, el problema es ridículamente mundano: el CMS que Anthropic usa para publicar su blog asigna URLs públicas a todos los assets por defecto al subirlos, a menos que el usuario cambie manualmente una configuración de privacidad. Alguien no la cambió. El resultado: casi tres mil archivos internos, incluyendo imágenes, PDFs, borradores de posts y detalles de un evento exclusivo con Dario Amodei, quedaron indexables públicamente. Fortune los encontró, los leyó y publicó el scoop.
Anthropic lo confirmó y lo llamó “error humano”. Correcto. Pero qué error.
Qué es Claude Mythos (y por qué va más allá de Opus)
El modelo filtrado se llama Claude Mythos en el branding público, pero internamente se documenta bajo el nombre de producto Capybara. Lo importante: no es un Opus 5 ni una iteración incremental. Es una nueva categoría de modelo, una capa encima de la jerarquía actual de Haiku, Sonnet y Opus.
Según el borrador expuesto y citado por CoinDesk, Anthropic describe a Mythos como:
- “Un step change en capacidades”: no una mejora marginal, sino un salto cualitativo
- Dramáticamente superior a Claude Opus 4.6 en codificación de software, razonamiento académico y, el punto polémico, ciberseguridad
- Capaz de detectar y explotar vulnerabilidades en codebases de producción a velocidades que superan la capacidad de respuesta de los defensores
- Descrito internamente como “actualmente muy por delante de cualquier otro modelo de IA en capacidades cibernéticas”
El modelo ya está en pruebas con un grupo reducido de early access. No hay fecha de lanzamiento público confirmada y el rollout es deliberadamente lento, enfocado primero en organizaciones defensivas de ciberseguridad.
El problema dual: el mismo modelo que defiende también puede atacar
Aquí está el nudo del asunto. Las capacidades de Mythos son dual-use por naturaleza: el mismo modelo que puede escanear tu codebase para encontrar vulnerabilidades desconocidas también puede ser usado por un atacante para hacer exactamente lo mismo contra el tuyo, pero más rápido y más barato.
El borrador filtrado no suaviza esto. Advierte que el modelo “presagia una ola de modelos que pueden explotar vulnerabilidades a un ritmo que supera los esfuerzos de los defensores”. Básicamente, Anthropic está diciendo en su propio documento interno que el modelo que están construyendo podría romper el equilibrio entre atacantes y defensores, y que los atacantes llevarían ventaja.
Esto no es hyperbole de marketing. Es una advertencia real de la empresa que lo construyó.
Hay contexto relevante aquí también: como ya habíamos reportado en nuestro análisis de la jueza que cuestionó al Pentágono sobre Anthropic, la compañía lleva meses navegando tensiones entre el uso gubernamental y civil de sus modelos. Mythos agrega otra capa a ese problema.
La reacción del mercado: caída en cascada de las cyber stocks
El viernes 27 de marzo, cuando Fortune publicó los detalles del leak, los mercados reaccionaron rápido y fuerte. Los inversores leyeron el mismo borrador que tú y yo, y llegaron a la misma conclusión: si una IA puede hacer el trabajo de un equipo entero de ciberseguridad, ¿para qué pagas $500 dólares por asiento mensual en CrowdStrike?
Las caídas del día según Investing.com:
| Empresa | Ticker | Caída |
|---|---|---|
| CrowdStrike | CRWD | ~7% |
| Palo Alto Networks | PANW | ~6% |
| Zscaler | ZS | ~4.5% |
| Fortinet | FTNT | ~4% |
| SentinelOne | S | ~3% |
| iShares Tech-Software ETF | IGV | ~2.5% |
Bitcoin también se fue de rodillas: de casi $70,000 a $66,000, con $171 millones en salidas de ETFs en un solo día. La narrativa de “IA disruptora” pegó en todo el mercado tech, no solo en ciberseguridad.
¿Es el pánico justificado?
La neta, sí y no.
Sí, porque si Mythos realmente puede identificar vulnerabilidades zero-day en codebases de producción a escala y velocidad industrial, cambia el cálculo de riesgo para cualquier empresa. Los equipos de red team van a tener acceso a herramientas que antes requerían talento humano escaso y caro. Y los malos van a intentar tener acceso a las mismas herramientas o a modelos similares.
No, porque el mercado siempre sobrereacciona al primer día de noticias como esta. El rollout deliberadamente lento de Anthropic, enfocado en defensores antes que en acceso general, sugiere que ya saben lo que tienen en las manos. No es como que van a poner Mythos en API pública el lunes con un free tier.
Además, como ya apuntamos en nuestro análisis de las startups de IA en LATAM en el contexto de Vera Rubin, el ciclo de disrupción de la IA en infraestructura crítica tiene tiempos largos. Las empresas de ciberseguridad tienen contratos multi-año, datos propios de telemetría y relaciones institucionales que no se reemplazan con un modelo de lenguaje, por muy capaz que sea.
Qué significa esto para México y LATAM
Directo: si trabajas en ciberseguridad en México, esto te toca más pronto de lo que crees.
Las empresas medianas mexicanas, que no tienen presupuesto para equipos de seguridad ofensiva completos, son exactamente el tipo de organización que se beneficia de una herramienta como Mythos para hacer auditorías de seguridad automatizadas a escala. Un modelo que puede revisar tu codebase completo en busca de vulnerabilidades desconocidas, al costo de una consulta de API, es potencialmente democratizador.
El problema es que esa democratización va en ambos sentidos. Los grupos de atacantes que operan en la región, incluyendo los que han apuntado a dependencias gubernamentales y financieras mexicanas, van a tener acceso a modelos equivalentes. No Mythos específicamente, pero sí a imitadores que van a aparecer en meses.
No hay acceso a Mythos disponible en México ni en ningún lado todavía. El early access es con un grupo cerrado y Anthropic no ha publicado criterios o fecha de apertura pública.
El meta-chiste: Anthropic filtró su modelo de seguridad por un fallo de seguridad
Vale la pena detenerse un segundo en esto porque es una chimba de ironía. La empresa que está entrenando el modelo de IA más avanzado del mundo en detección de vulnerabilidades de seguridad acaba de exponer sus secretos más sensibles por un checkbox mal puesto en un CMS. No fue un ataque sofisticado, no fue un hack de estado-nación. Fue un default mal configurado en su herramienta de gestión de contenido.
Si Mythos existiera hace seis meses y Anthropic lo hubiera usado internamente para auditar sus propios sistemas, ¿habría detectado este problema? Esa pregunta queda en el aire.
Lo que sigue es esperar confirmaciones oficiales de fechas y disponibilidad. Por ahora, lo único real es que el modelo existe, que está en pruebas, y que la industria ya reaccionó. Si eres desarrollador o trabajas en seguridad en México, mantente al tanto porque este año el juego cambia.
¿Ya usas Claude o cualquier modelo de Anthropic en tu flujo de trabajo? Cuéntame en los comentarios cómo lo estás integrando.
Fuentes
- Fortune: Anthropic ‘Mythos’ AI model revealed in data leak
- Fortune: Anthropic leaked AI model with unprecedented cybersecurity risks
- CoinDesk: Anthropic’s massive Claude Mythos leak
- Investing.com: Cybersecurity stocks plunge on Claude Mythos leak
- lowcode.agency: What is Claude Mythos (Capybara)
- Futurism: Anthropic leaked upcoming model with unprecedented cybersecurity risks
Comentarios
No te pierdas ningún post
Recibe lo nuevo de Al Chile Tech directo en tu correo. Sin spam.
También te puede interesar
Claude sacó su propio OpenClaw: ahora mandas tareas desde el celular y tu PC las ejecuta
Anthropic lanzó Dispatch para Claude Cowork, una función que te deja controlar tu escritorio desde el teléfono. Así le responde a OpenClaw, pero con sandbox y sin los pedos de seguridad.
Anthropic vs. el Pentágono: la empresa de IA que le dijo NO a las armas autónomas
Anthropic, los creadores de Claude, se negaron a dar su IA al Pentágono para armas autónomas y vigilancia masiva. El gobierno los declaró 'riesgo de cadena de suministro'. Anthropic demandó. Esta es la pelea que define el futuro de la IA.
Anthropic bloquea las suscripciones de Claude en herramientas de terceros como OpenClaw: qué cambia desde el 4 de abril
Desde el 4 de abril de 2026, usar Claude Pro o Max en harnesses como OpenClaw o NanoClaw requiere pago extra por uso. Te explicamos qué pasó, por qué, y qué puedes hacer.