Claude Mythos encontró miles de zero-days en Windows, Chrome y macOS sin intervención humana: y nadie sabe quién va a parchearlos
El Project Glasswing de Anthropic usó Claude Mythos Preview para descubrir autónomamente miles de vulnerabilidades críticas en todos los sistemas operativos y navegadores principales. El problema: menos del 1% están parcheados. Lo que México necesita saber ya.
Hay una IA que ya puede hackear tu computadora, tu navegador y tu servidor sin que ningún humano le diga cómo. Lo hace sola, de noche, mientras duermes. Y Anthropic acaba de confirmarlo públicamente con números que quitan el sueño.
El 7 de abril de 2026, Anthropic publicó en su blog de seguridad los resultados de lo que internamente llaman Claude Mythos Preview: un modelo de IA frontier que, según sus propias pruebas, puede descubrir y explotar vulnerabilidades de software a un nivel que supera a casi cualquier humano experto en seguridad. El problema no es solo que las encuentre. El problema es que el 99% de lo que encontró sigue sin parche.
Qué es Project Glasswing y por qué importa
Para contextualizar: Anthropic no lanzó a Claude Mythos al mundo y se fue a dormir. Crearon Project Glasswing, una iniciativa defensiva de $100 millones de dólares en créditos de uso, más $4 millones en donaciones directas a organizaciones de seguridad open source como la Apache Software Foundation y OpenSSF.
La idea, al menos en papel, es usar a Mythos como el mejor auditor de seguridad de la historia: que encuentre los bugs primero para que los buenos los parcheen antes de que los malos los exploten.
Solo 12 organizaciones tienen acceso como socios iniciales: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks, y la propia Anthropic. A ellas se suman más de 40 organizaciones adicionales que mantienen infraestructura crítica de software.
El modelo NO está disponible para el público general, ni lo estará pronto. Anthropic fue muy directa al respecto.
Los hallazgos que nadie esperaba
Cuando dicen “miles de zero-days en todos los sistemas operativos y navegadores principales”, no es hipérbole de marketing. Los números concretos:
Contra el corpus de OSS-Fuzz (unas 1,000 repositorios de código abierto), Mythos Preview logró 595 crashes de severidad básica y 10 instancias de control total del flujo de ejecución, la categoría más grave. Los modelos anteriores de Anthropic, Opus 4.6 y Sonnet 4.6, apenas lograron 1 crash de categoría media cada uno.
En Firefox 147, Mythos desarrolló exploits funcionales en 181 intentos. Claude Opus 4.6 logró 2 en varios cientos de intentos. Esa brecha es descomunal.
Pero los casos más escandalosos son los bugs viejos que encontró:
CVE-2026-4747 en FreeBSD (17 años de antigüedad): una vulnerabilidad de ejecución remota de código en el servidor NFS que permite a cualquier atacante obtener acceso root completo desde internet, sin autenticación. El exploit que Mythos construyó de forma autónoma encadenó múltiples vulnerabilidades usando una cadena ROP de 20 gadgets distribuida en varios paquetes. Lo hizo de la noche a la mañana, sin intervención humana después de la instrucción inicial.
Bug en OpenBSD (27 años de antigüedad): un desbordamiento de entero en la implementación TCP SACK que permite crashear cualquier host OpenBSD que responda por TCP. Un sistema operativo conocido precisamente por su enfoque obsesivo en la seguridad, con una vulnerabilidad de casi tres décadas que nadie había visto.
FFmpeg (16 años de antigüedad): una colisión de valor centinela en el codec H.264 que el fuzzing automatizado había rozado millones de veces sin activar.
En el benchmark CyberGym de reproducción de vulnerabilidades, Mythos Preview obtuvo 83.1%. Claude Opus 4.6 logró 66.6%. La diferencia es relevante cuando hablamos de exploits reales.
El problema que nadie resuelve: ¿quién va a parchar todo esto?
Aquí está el verdadero tema de la semana. The Hacker News lo preguntó directamente: “Project Glasswing probó que la IA puede encontrar los bugs. ¿Quién los va a arreglar?”
Menos del 1% de las vulnerabilidades encontradas por Mythos han sido parcheadas hasta ahora. No porque Anthropic no las haya reportado: el protocolo de divulgación responsable incluye hasta 90 días más 45 adicionales antes de revelación pública. El problema es que el ecosistema de software simplemente no tiene la capacidad de digerir este volumen de hallazgos legítimos al ritmo en que una IA los produce.
Los mantenedores de proyectos open source, muchos de ellos voluntarios con otro trabajo de tiempo completo, reciben de repente un reporte de vulnerabilidad crítica para código que nadie había auditado en décadas. Las empresas tienen ciclos de parche que no han cambiado fundamentalmente en diez años. Y mientras tanto, el tiempo promedio desde la divulgación hasta un exploit funcional en manos de atacantes ha caído de 771 días en 2018 a horas en 2024.
La ironía es brutal: Anthropic construyó un sistema para dar ventaja a los defensores, pero si los defensores no pueden procesar la información a tiempo, el sistema crea una ventana de exposición enorme. El debate en Hacker News sobre los problemas de divulgación de hardware que nadie está discutiendo va exactamente en esa dirección.
Como ya vimos con el filtrado accidental de Claude Mythos hace unas semanas, el solo rumor de que este modelo existía fue suficiente para sacudir las bolsas de ciberseguridad. Ahora que los detalles técnicos son públicos, la presión es mucho mayor.
Lo que México necesita saber hoy
México no está en la lista de las 12 organizaciones con acceso a Mythos Preview. Apple, Google y Microsoft sí están, y en teoría van a parchear los bugs que les corresponden en sus sistemas. Pero el ecosistema de software que usa el gobierno mexicano, la banca, y las empresas medianas es mucho más amplio que Windows, macOS y Chrome.
Los sistemas de banca en México, como en todo el mundo, corren stacks híbridos: interfaces modernas sobre código que en muchos casos tiene 15 o 20 años. Los servidores de dependencias de gobierno federal corren Linux en múltiples distribuciones. Las universidades y hospitales usan FreeBSD en algunos casos, y prácticamente todos los sistemas HTTP dependen de software como FFmpeg para procesamiento de video y medios.
El problema de la deuda técnica no es nuevo, pero Glasswing lo volvió urgente: lo que antes era “un riesgo teórico de exploits en software antiguo” ahora es “un modelo de IA ya sabe exactamente cómo ejecutar ese exploit y dejó las instrucciones en un documento que Anthropic tiene bajo llave con hash criptográfico”. La ventana de exposición existe, y se cierra solo cuando el parche llega.
Para organizaciones en México fuera del círculo de Glasswing, el AEI lo dijo claro: la deuda técnica ya es un riesgo de seguridad nacional. No es exageración: los mismos sistemas que procesan nómina del IMSS, que controlan el SAT, que operan SPEI, corren sobre capas de software que Mythos podría auditar en horas.
El tema conecta directamente con algo que ya hemos discutido: la IA ya está transformando radicalmente las decisiones de inversión en infraestructura tech, y México va siempre un paso atrás en adoptar las defensas.
Qué hacer si eres dev o trabajas en IT
Si administras servidores o desarrollas software para instituciones en México, los pasos inmediatos son concretos:
-
Actualiza ya: FreeBSD parcheó CVE-2026-4747. Si tienes NFS expuesto, ese parche es crítico. OpenBSD lanzó el fix para el bug de SACK. Si usas FFmpeg, verifica la versión.
-
Revisa tu exposición a OSS desactualizado: el vector de ataque de Mythos es especialmente efectivo contra software que lleva años sin auditoría formal. CVE databases más viejas que 2023 merecen atención nueva.
-
No asumas que “nunca te han atacado” = “eres seguro”: la diferencia ahora es que un atacante con acceso a modelos similares puede encontrar el bug que llevaba 17 años esperando en minutos.
-
Monitorea los advisories de Glasswing: Anthropic usa hashes SHA-3 para documentar vulnerabilidades sin revelarlas hasta que haya parche. Cuando el hash se convierte en CVE público, tienes que actuar rápido.
El fondo del asunto
Lo que hizo Anthropic con Glasswing es una chimba de movimiento estratégico: tomaron una capacidad que podría usarse para destruir infraestructura global y la convirtieron en una iniciativa defensiva pública con socios reconocibles. Pero la pregunta que nadie puede responder todavía es si el ecosistema global de software puede adaptarse a este nuevo ritmo antes de que alguien con menos buenas intenciones desarrolle algo similar.
Mythos Preview no es público. Pero los modelos de IA de seguridad ofensiva van a seguir mejorando, vengan de donde vengan. La brecha entre lo que la IA puede encontrar y lo que los humanos pueden parchear ya existe. Project Glasswing le puso nombre al problema. Nadie todavía tiene la solución completa.
¿Tu empresa o institución ya tiene un plan de respuesta para cuando llegue el primer exploit masivo basado en IA? Si no, ésa es la conversación que debe pasar en la próxima junta de IT.
Fuentes
- Project Glasswing: Securing critical software for the AI era - Anthropic
- Claude Mythos Preview - red.anthropic.com
- Project Glasswing Proved AI Can Find the Bugs. Who’s Going to Fix Them? - The Hacker News
- Anthropic’s Claude Mythos Finds Thousands of Zero-Day Flaws Across Major Systems - The Hacker News
- Anthropic’s Project Glasswing Is a Warning: Technical Debt Is Now a National Security Risk - AEI
- Mythos, Glasswing, and the hardware disclosure problem nobody is discussing - Hacker News
- Anthropic launches Project Glasswing - Engadget
Comentarios
No te pierdas ningún post
Recibe lo nuevo de Al Chile Tech directo en tu correo. Sin spam.
También te puede interesar
Claude Mythos encontró zero-days en todos los sistemas operativos del mundo: Anthropic la encerró en Project Glasswing y solo 50 empresas tienen acceso
La IA más poderosa de Anthropic descubrió miles de vulnerabilidades críticas en Windows, Linux, macOS y los principales navegadores. Por eso no la vas a poder usar nunca.
Google apuesta $40,000 millones en Anthropic: la inversión más grande de la historia en IA y lo que cambia para México
Google mete $10B inmediatos y hasta $30B condicionales en Anthropic a valuación de $350 mil millones. Así quedó el tablero entre Google, Microsoft y OpenAI, y qué significa para devs y empresas en México.
Anthropic investiga acceso no autorizado a Claude Mythos: el modelo que hackea todo fue 'hackeado'
Un grupo accedió sin permiso a Claude Mythos, el modelo de IA más poderoso de Anthropic diseñado para ciberseguridad. Qué pasó, cómo lo lograron y qué implica para las empresas que lo usan vía Amazon Bedrock.