
Modelo secreto de Anthropic, Claude Mythos, plantea riesgos de ciberseguridad sin precedentes y alegra al Pentágono
Un filtrado de Anthropic ha expuesto detalles de Claude Mythos, un modelo de IA que la empresa califica como “el más potente que hemos desarrollado”. Según el borrador filtrado, supera al actual Claude Opus 4.6 y presenta riesgos de ciberseguridad sin precedentes, lo que ha provocado la satisfacción del Pentágono. El Departamento de Defensa, que mantiene una disputa con Anthropic por el uso militar de sus sistemas, ve en el modelo una oportunidad estratégica, mientras la compañía advierte que su lanzamiento podría ser demasiado peligroso.
[twitter=2037396261775798335]
¿Qué es Claude Mythos y por qué causa alarma?
Claude Mythos es el nombre interno de un modelo de IA que Anthropic describe como “el más potente que hemos desarrollado”. Según el borrador filtrado, supera al público Claude Opus 4.6 en benchmarks de lenguaje y, según la empresa, está “muy adelantado” en capacidades de ciberseguridad, lo que lo convierte en una herramienta potencialmente peligrosa si se libera sin control.
El modelo habría requerido una inversión enorme para su entrenamiento y operación, tanto que Anthropic aún no define una estrategia de despliegue. La filtración sugiere que la compañía dejó accesible información confidencial en su CMS, lo que permitió que investigadores externos descubrieran detalles críticos antes de cualquier anuncio oficial público global.
El Pentágono y su entusiasmo por el modelo
El Departamento de Defensa ha recibido la noticia con entusiasmo, viendo en Claude Mythos una ventaja estratégica frente a adversarios. A pesar de una disputa legal que impide al DoD calificar a Anthropic como riesgo de seguridad, los altos mandos militares han utilizado la filtración para reforzar su posición en el debate sobre la adopción de IA avanzada en entornos militares.
El Subsecretario de Guerra, Emil Michael, ha criticado públicamente a Anthropic, acusando a su CEO de buscar controlar al ejército estadounidense. Sin embargo, sus comentarios parecen motivados por intereses financieros en competidores de IA, lo que complica la percepción pública del conflicto entre la empresa y el Pentágono actual global significativo.
Riesgos de ciberseguridad y la polémica legal
Anthropic advierte que Claude Mythos presenta riesgos de ciberseguridad sin precedentes, pues su capacidad para generar código malicioso o vulnerar sistemas podría ser explotada por actores hostiles. La empresa ha decidido retener el modelo mientras evalúa medidas de mitigación, aunque la filtración ha puesto en evidencia la fragilidad de sus propios protocolos de seguridad.
Mientras tanto, un juez ha bloqueado temporalmente al DoD la posibilidad de etiquetar a Anthropic como riesgo de seguridad, lo que mantiene la disputa en el ámbito judicial y de opinión pública. La combinación de un modelo tan potente y la falta de claridad regulatoria genera incertidumbre sobre cuándo y cómo se podrá usar de forma segura.
