
la ia que hackea sola: anthropic frena el lanzamiento de claude mythos por riesgo extremo
Imagina un programa capaz de colarse en tu móvil o ordenador sin que nadie le diga cómo. Eso es justo lo que ha entrenado Anthropic con su nuevo modelo Claude Mythos, una inteligencia artificial tan lista que la propia empresa ha decidido guardarla en un cajón para que no cause estragos.
El sistema ha demostrado ser capaz de encontrar fallos de seguridad que llevaban años escondidos. Por ejemplo, descubrió una vulnerabilidad en OpenBSD que nadie había visto en 27 años. También localizó un agujero en FFmpeg que se había pasado por alto durante 16 años y que los programas de prueba habían revisado cinco millones de veces sin detectar.
Lo más bestia llegó cuando la IA combinó varios fallos del kernel de Linux, creó su propio método de ataque y se hizo con el control total del sistema. Ante semejante nivel de peligro, Anthropic ha dicho basta: este modelo no saldrá a la venta. La compañía solo publicará la ficha técnica para que otros investigadores aprendan, pero no habrá versión pública ni de prueba.
Cómo una IA se convierte en hacker sin ayuda
Claude Mythos no solo genera código rápido; piensa como un experto en ciberseguridad. Durante las pruebas internas, el modelo analizó millones de líneas de código, detectó patrones sospechosos y, en cuestión de minutos, diseñó ataques que un humano tardaría meses en idear.
El truco está en su forma de razonar: en lugar de buscar fallos conocidos, imagina nuevas formas de romper el sistema. Es como si tuviera una imaginación maliciosa, pero controlada. De ahí que Anthropic haya preferido frenar antes de que alguien use esa creatividad destructiva fuera de un laboratorio.
Las víctimas: sistemas que creíamos seguros
OpenBSD presume de ser uno de los sistemas operativos más duros del planeta. Sin embargo, Claude Mythos encontró una grieta que se había escondido desde 1997. El mismo golpe sucedió con FFmpeg, el rey del vídeo en código abierto: un fallo que los tests automatizados habían marcado como seguro cinco millones de veces.
El caso más sonado fue el kernel de Linux. La IA descubrió varias vulnerabilidades, las enlazó como si fueran piezas de Lego y construyó una puerta trasera que le daba acceso total. Todo sin que un ingeniero tocara el teclado.
Por qué nadie podrá descargar este súper cerebro
Anthropic tiene claro que sacar Claude Mythos al mercado sería como regalar un ladrillo de oro a un pirata informático. La empresa ha optado por la contención total: ni versión beta, ni API, ni pruebas selectas. Solo un informe técnico para que la comunidad científica entienda el avance sin poner en riesgo a usuarios normales.
El plan a largo plazo es aprovechar esa potencia en áreas menos explosivas, como la medicina o el diseño de materiales. Mientras tanto, la IA más hackeadora del mundo seguirá guardada bajo llave, lejos de curiosos y delincuentes.
