OPINIÓN CIBERSEGURIDAD

Los mitos de Mythos



Dirección copiada

Un análisis crítico sobre la nueva AI de Anthropic. Datos reales de costos y automatización que líderes IT deben evaluar frente al hype del sector.

Publicado el 2 jun 2026

Pablo Corona

Director de Servicios de ciberseguridad de NYCE



Pantalla de smartphone que muestra el logotipo de Anthropic Claude Mythos sobre el teclado de una computadora portátil.
Crédito: Archivo Shutterstock

La aparición de Claude Mythos Preview, el modelo de Anthropic orientado a capacidades avanzadas de análisis y explotación de vulnerabilidades, ha generado una mezcla de entusiasmo, preocupación y ruido. No es cosa menor.

Anthropic afirma que Mythos ha encontrado miles de vulnerabilidades de alta severidad, incluso en sistemas operativos y navegadores relevantes; que bajo Project Glasswing lo está poniendo en manos de un grupo limitado de organizaciones para fines defensivos.

También reportaron que, en sus evaluaciones internas, Mythos logró 10 casos de secuestro completo de flujo de control (control-flow hijack) en objetivos plenamente parchados, algo que va más allá de encontrar errores: implica demostrar la capacidad de influir en el flujo de ejecución de un programa.

Pero precisamente por eso conviene separar el avance técnico del mito comercial. Mythos puede ser importante; incluso puede ser un punto de inflexión. Sin embargo, también puede estar rodeado de hype, que no ocurre en el vacío.

Los cinco mitos sobre Mythos de Anthropic

La empresa que dirige Dario Amodei se encuentra entre las compañías de inteligencia artificial (AI) que podrían formar parte de una ola histórica de salidas a bolsa en 2026, con valuaciones enormes y todavía sin rentabilidad consolidada.

Recientemente, la empresa cerró una ronda de financiamiento de $65,000 millones de dólares (mdd) que ubicó su valuación en $965,000 mdd, rozando el umbral del billón de dólares y convirtiéndola en la startup de AI más valiosa del mundo, por encima de OpenAI.

En ese contexto, cualquier narrativa sobre “el modelo que cambia la ciberseguridad” debe leerse con interés, pero también con cautela.

Primer mito

El primer mito es que Mythos representa una ruptura absoluta con todo lo anterior. No me parece así, tal vez por viejito, pero es algo que ya vivimos o al menos algo parecido con los fuzzers, los decompiladores, los scanners de vulnerabilidades, los sistemas de análisis estático, los bug bounty programs, CodeQL, los EDR, los XDR y las plataformas de DevSecOps.

Cada una de estas herramientas produjo, en su momento, una ansiedad similar: “Esto va a beneficiar más a los atacantes que a los defensores” o “va a desaparecer la profesión”.

Y en parte fue cierto al inicio. Pero con el tiempo, many de esas herramientas terminaron siendo infraestructura básica de defensa. Google OSS-Fuzz, por ejemplo, reporta que para mayo de 2025 había ayudado a identificar y corregir más de 13,000 vulnerabilidades y 50,000 bugs en más de 1,000 proyectos.

La diferencia con Mythos no es que una herramienta automatizada pueda encontrar fallas. Eso ya lo sabíamos. La diferencia está en la combinación de razonamiento, autonomía, generación de código, análisis contextual y capacidad de encadenamiento.

Anthropic reportó que Mythos desarrolló exploits funcionales 181 veces en un benchmark donde Opus 4.6 lo había logrado solo dos veces, y que además alcanzó control de registros en 29 ocasiones adicionales.

Segundo mito

En otro benchmark, contra miles de puntos de entrada de repositorios de OSS-Fuzz, modelos previos llegaron a crashes de baja severidad, mientras Mythos produjo 595 crashes de niveles 1 y 2, algunos de niveles 3 y 4, y los 10 casos de control-flow hijack completo. Aquí aparece el segundo mito: que la AI descubre vulnerabilidades “desde la nada”.

En realidad, los modelos aprenden de patrones existentes: código vulnerable, parches, reportes, write-ups, exploits, CVE, pruebas, documentación y estructuras repetidas en software real.

Por eso es razonable pensar que veremos un pico inicial en el número de vulnerabilidades encontradas. Habrá mucho código con patrones conocidos que nunca fue revisado con esta intensidad. Habrá proyectos viejos, dependencias olvidadas, librerías críticas y sistemas heredados donde estos modelos van a encontrar fallas que estaban ahí desde hace años.

Pero ese pico no necesariamente crecerá indefinidamente. Conforme se limpien patrones recurrentes y se automaticen mejores prácticas de desarrollo y remediación, el volumen de hallazgos explotables podría estabilizarse o incluso reducirse en ciertos ecosistemas maduros.

La advertencia es que esa reducción no será automática. La AI puede combinar vulnerabilidades de formas que a un investigador humano quizá no se le habrían ocurrido, o que sí se le habrían ocurrido, pero después de días o semanas de análisis.

Mythos, según Anthropic, llegó a construir un exploit de navegador encadenando cuatro vulnerabilidades y escapando de sandboxes. Ese tipo de composición es precisamente lo que hace interesante el fenómeno: no solo detecta patrones conocidos; puede probar combinaciones, formular hipótesis, generar scaffolding, modificar código, ejecutar pruebas y repetir el ciclo a una velocidad que cambia la economía de la investigación.

Tercer mito

El tercer mito es que el problema principal será “encontrar más vulnerabilidades”. El problema será remediarlas. Encontrar una vulnerabilidad no reduce el riesgo si no se valida, prioriza, corrige, prueba y despliega el cambio.

De hecho, encontrar más vulnerabilidades sin exploits no siempre se materializa en ataques reales, pero estas vulnerabilidades y exploits sin capacidad de remediación empeora el problema, tenemos más backlog, más excepciones, más falsas prioridades, más presión sobre desarrollo y más deuda técnica visible.

El riesgo no está solo en el hallazgo; está en la brecha entre la velocidad de descubrimiento y la velocidad de respuesta. Ese desfase ya es medible.

Verizon reportó en su DBIR 2026 que la explotación de vulnerabilidades se convirtió por primera vez en el principal punto de entrada de brechas, con 31% de los casos, superando al robo de credenciales. El mismo reporte señala que la AI está acelerando el tiempo de explotación de vulnerabilidades conocidas, reduciendo la ventana defensiva de meses a horas.

Mandiant, por su parte, reportó en M-Trends 2026 que los exploits fueron el vector inicial más común por sexto año consecutivo, con 32% de las intrusiones investigadas.

Más inquietante todavía: el tiempo entre el acceso inicial y el traspaso a un segundo grupo criminal cayó de más de ocho horas en 2022 a 22 segundos en 2025. Esa cifra resume el problema: muchas organizaciones siguen operando con tiempos de comité, mientras el adversario opera con tiempos de automatización.

Cuarto mito

El cuarto mito es que los investigadores de seguridad van a desaparecer. No lo creo. Lo que desaparecerá, o quedará relegado, es una forma de investigar que dependa exclusivamente de trabajo manual repetitivo.

El investigador que no use AI para ampliar su capacidad perderá velocidad frente a quien sí la use. Pero también será insuficiente quien solo use la inteligencia artificial sin criterio técnico, sin capacidad de validación, sin conocimiento de arquitectura, entendimiento de riesgo y sin responsabilidad sobre el resultado.

La nueva diferencia no estará entre humanos y máquinas, sino entre equipos que saben dirigir sistemas de AI y equipos que se limitan a reaccionar ante sus hallazgos. El investigador valioso no será sustituido por esta tecnología; será el que sepa preguntarle mejor, acotarlo mejor, validar sus resultados, detectar falsos positivos, entender impactos reales y convertir hallazgos en reducción de exposición.

Lo mismo aplica para SOC, AppSec, red teams, blue teams, gestión de vulnerabilidades y respuesta a incidentes.

Quinto mito

El quinto mito es que estas capacidades solo beneficiarán a atacantes. Serán utilizadas por atacantes, sin duda y de manera más ágil, porque ellos no tienen marcos de compliance, regulaciones y normas.

La preocupación de Anthropic parte de que capacidades similares podrían proliferar fuera de ambientes controlados. Pero estas capacidades eventualmente también serán democratizadas y serán utilizadas por defensores. De hecho, ya lo están siendo.

Google reportó que Big Sleep, un agente desarrollado por Google DeepMind y Project Zero, descubrió la vulnerabilidad CVE-2025-6965 en SQLite, una falla crítica que, según Google, era conocida solo por actores de amenaza y estaba en riesgo de explotación.

DARPA también mostró avances relevantes con el AI Cyber Challenge. En la final de 2025, los sistemas participantes encontraron 54 vulnerabilidades sintéticas uniques de 63 desafíos y parchearon 43 de ellas. Un año antes, en la semifinal de 2024, habían encontrado 22 vulnerabilidades sintéticas y parcheado 15.

No es todavía una sustitución plena del ciclo de ingeniería segura, pero sí una señal clara: la AI no solo encuentra fallas; empieza a participar en la corrección. Por eso la conversación debe ampliarse.

La AI será usada para identificar vulnerabilidades, pero también para remediación, parcheo, monitoreo, contención, hardening, respuesta y recuperación. En ambientes maduros, un agente no solo dirá “aquí hay una vulnerabilidad”; propondrá un parche, generará una prueba de regresión, revisará dependencias, evaluará impacto, abrirá un pull request, propondrá y verificará controles compensatorios, monitoreará indicadores de compromiso y actualizará tickets de riesgo.

En ambientes inmaduros, en cambio, producirá más ruido de lo que la organización puede absorber.

Mythos no es una anomalía aislada

Los datos de volumen de vulnerabilidades ya muestran que el ecosistema está saturado incluso antes de que las capacidades de Mythos se generalicen. NIST señaló en abril de 2026 que las solicitudes de CVE crecieron 263% entre 2020 y 2025, y que en el primer trimestre de 2026 iban casi un tercio arriba del mismo periodo del año anterior.

Además, aunque NIST enriqueció casi 42,000 CVE en 2025, 45% más que cualquier año previo, reconoció que esa productividad ya no alcanza para procesarlo todo bajo el modelo tradicional.

Pero Mythos no es el único indicio de esta transición. Sería un error analizarlo como si Anthropic hubiera descubierto en solitario una nueva categoría de capacidad. Lo que estamos viendo es una convergencia entre varios modelos frontera y sistemas agentivos especializados en ciberseguridad.

OpenAI, por ejemplo, ha presentado GPT-5.4-Cyber, GPT-5.5 con Trusted Access for Cyber y Codex Security como parte de su iniciativa Daybreak, orientada a identificar amenazas, generar parches y verificar remediación en código y sistemas, con acceso más permisivo para defensores verificados.

Google, por su parte, ha reportado que su agente Big Sleep descubrió vulnerabilidades reales, incluida CVE-2025-6965 en SQLite, una falla crítica que Google afirmó que era conocida solo por actores de amenaza y estaba en riesgo de explotación.

Incluso fuera de los laboratorios privados, el AI Cyber Challenge de DARPA mostró que sistemas autónomos de razonamiento cibernético pudieron descubrir 54 vulnerabilidades sintéticas únicas de 63 desafíos y parchear 43 de ellas.

Entonces, la lectura correcta no es que Mythos sea una anomalía aislada, sino que representa una manifestación visible de una tendencia más amplia: los modelos frontera ya están entrando en el ciclo completo de seguridad de software, desde el descubrimiento y validación de vulnerabilidades hasta la generación de correcciones, pruebas y priorización defensiva.

En números anuales, análisis basados en datos de NVD y la lista oficial CVE V5 estiman que en 2025 se publicaron 48,185 CVE, frente a 39,962 en 2024, un incremento de 20.6%.

Ese aumento no puede atribuirse exclusivamente a la AI; influyen más la Autoridad de Asignación de Números CVE (CNA), más software, más open source, más dependencias, más bug bounty y mejores procesos de disclosure.

Pero sí marca el terreno sobre el cual aterriza Mythos: los equipos de seguridad ya no pueden revisar, priorizar y remediar vulnerabilidades con procesos manuales pensados para un volumen mucho menor.

El costo de no automatizar la seguridad

Los datos de costos también empiezan a mostrar una diferencia. IBM reportó en su Cost of a Data Breach Report 2025 que las organizaciones que usan ampliamente AI y automatización en operaciones de seguridad ahorraron en promedio $1.9 millones de dólares en costos de brecha y redujeron el ciclo de vida de la brecha en 80 días frente a organizaciones que no las usan ampliamente.

El mismo reporte ubicó el costo global promedio de una brecha en $4.44 millones de dólares, mientras que el costo promedio en Estados Unidos llegó a $10.22 mdd.

Sin embargo, hay que leer estos datos con cuidado. No existe todavía una medición global limpia de “antes de AI” y “después de AI” para vulnerabilidades, remediación y costos.

Lo que tenemos son comparaciones parciales: organizaciones con mayor uso de inteligencia artificial y automatización frente a las que no lo tienen, competencias como el desafío cibernético de inteligencia artificial (AIxCC) en entornos controlados, benchmarks de proveedores, incrementos de CVE en el ecosistema y reportes de incidentes donde la explotación de vulnerabilidades ya domina los vectores de acceso.

La conclusión prudente no es que “la AI ya resolvió la ciberseguridad”, sino que la seguridad sin automatización inteligente ya no escala.

El peligro del shadow AI

También hay que mirar el otro lado: no solo cómo la inteligencia artificial ayuda a la ciberseguridad, sino cómo hacemos ciberseguridad de la AI.

Si una organización conecta agentes a repositorios, pipelines CI/CD, sistemas de tickets, SIEM, SOAR, nube, endpoints o ambientes productivos, la AI se convierte en superficie de ataque.

Requiere gobierno, identidad, segregación de funciones, permisos y privilegios, monitoreo, trazabilidad, límites de acción, revisión humana para cambios críticos, pruebas, bitácoras, gestión de secretos, protección contra prompt injection and evaluación continua de salidas.

IBM reportó que 13% de las organizaciones estudiadas tuvieron brechas de modelos o aplicaciones de AI y que 97% de ellas carecían de controles adecuados de acceso para la inteligencia artificial.

También señaló que una de cada cinco organizaciones reportó una brecha vinculada a shadow AI y que los incidentes con shadow AI generaron costos promedio $670,000 dólares mayores que aquellos con bajo o nulo uso de shadow AI.

Esto importa porque la inteligencia artificial no debe verse solo como herramienta ofensiva o defensiva. Debe verse como advertencia arquitectónica. Cuando una AI puede razonar sobre código, invocar herramientas, proponer cambios y ejecutar ciclos de prueba, la frontera entre análisis, decisión y acción se vuelve más delgada y debe gobernarse.

No todo hallazgo debe convertirse en parche automático. No todo parche debe desplegarse. No toda recomendación debe aceptarse. Y no todo agente debe tener permisos amplios solo porque “trabaja para seguridad”.

En ese sentido, Mythos y cualquier otra AI no rompen la ciberseguridad, sino una ilusión: la de que podemos seguir gestionando vulnerabilidades con hojas de cálculo, ventanas mensuales, priorización basada solo en el Sistema Común de Puntuación de Vulnerabilidades (CVSS), dueños difusos, excepciones eternas y remediación manual.

El futuro del CISO en la era AI

Lo que viene no es la desaparición del CISO ni del investigador de seguridad. Es la desaparición gradual de los modelos operativos que no puedan convertir inteligencia en acción verificable.

La pregunta correcta no es si Mythos es hype o revolución. Puede tener algo de ambos. La pregunta correcta es qué hará cada organización cuando el volumen de hallazgos aumente, cuando los atacantes automaticen combinaciones que antes requerían especialistas, cuando los defensores tengan herramientas similares, y cuando el factor competitivo ya no sea encontrar vulnerabilidades, sino cerrarlas más rápido, con menor costo, menor interrupción y mayor evidencia.

La AI no hará magia. No eliminará la necesidad de criterio humano. No volverá irrelevantes a los investigadores. No beneficiará solo a atacantes. No resolverá por sí misma la deuda técnica. Pero sí acelerará el ciclo completo: descubrimiento, explotación, priorización, remediación, monitoreo y recuperación.

Y en ciberseguridad, cuando cambia la velocidad del ciclo, se debe cambiar la estrategia.

Artículos relacionados