La IA ya no sólo ayuda a los ciberataques: ahora puede llevarlos a cabo

Tabla de contenido

Siga ZDNET: Agréganos como fuente preferida en Google.

Conclusiones clave de ZDNET

Anthropic documentó un ciberataque a gran escala utilizando IA.
Anthropic dice que la culpa es de un grupo patrocinado por el Estado chino.
El ataque puede ser el primer caso de este tipo.

Se ha registrado la primera campaña de ciberataque a gran escala que aprovecha la inteligencia artificial (IA) como algo más que una simple ayuda digital.

- Advertisement -[wpcode id="699"]

Como informó por primera vez el Diario de Wall StreetAnthropic, la empresa detrás de Claude, un asistente de IA, publicó un informe (.PDF) que documenta el abuso de sus modelos de IA, secuestrados en una campaña de ataque a gran escala dirigida simultáneamente a múltiples organizaciones.

¿Qué pasó?

A mediados de septiembre, Anthropic detectó una «operación de ciberespionaje altamente sofisticada» que utilizaba IA durante todo el ciclo de ataque.

Se abusó de Claude Code, IA agente, en la creación de un marco de ataque automatizado capaz de «reconocimiento, descubrimiento de vulnerabilidades, explotación, movimiento lateral, recolección de credenciales, análisis de datos y operaciones de exfiltración». Además, estas etapas se realizaron «en gran medida de forma autónoma», con operadores humanos proporcionando supervisión básica después de encargarle a Claude Code que operara como «orquestadores y agentes de pruebas de penetración»; en otras palabras, fingir ser un defensor.

La IA no solo encontró vulnerabilidades en las organizaciones objetivo, sino que también permitió su explotación, el robo de datos y otras actividades maliciosas posteriores a la explotación.

- Advertisement -[wpcode id="699"]

Leer Codex Desktop de OpenAI puede ejecutar su computadora ahora y tiene su propio navegador

Según Anthropic, esto no solo resultó en que organizaciones de alto perfil fueran atacadas, sino que entre el 80% y el 90% de las «operaciones tácticas» fueron operadas de forma independiente por la IA.

«Al presentar estas tareas a Claude como solicitudes técnicas de rutina a través de indicaciones cuidadosamente diseñadas y personas establecidas, el actor de amenazas pudo inducir a Claude a ejecutar componentes individuales de cadenas de ataque sin acceso al contexto malicioso más amplio», dijo Anthropic.

¿Quién fue el responsable y cómo respondió Anthropic?

Según Anthropic, un grupo patrocinado por el estado chino supuestamente estuvo en el centro de la operación. Ahora rastreado como GTG-1002 y se cree que cuenta con buenos recursos y respaldo estatal, el grupo aprovechó a Claude en su campaña, pero se sabe poco más sobre ellos.

Una vez que Anthropic descubrió el abuso de sus tecnologías, rápidamente prohibió las cuentas asociadas con GTG-1002 y expandió sus sistemas de detección de actividades maliciosas, que con suerte descubrirán lo que la compañía llama «patrones de amenazas novedosos», como el juego de roles utilizado por GTG-1002 para hacer que el sistema actúe como un genuino probador de penetración basado en defensa.

Anthropic también está creando prototipos de medidas de detección temprana para detener los ciberataques autónomos, y tanto las autoridades como la industria fueron informadas del incidente.

Sin embargo, la compañía también emitió una advertencia a la comunidad de ciberseguridad en general, instándola a permanecer alerta:

«La comunidad de ciberseguridad debe asumir que se ha producido un cambio fundamental: los equipos de seguridad deben experimentar aplicando IA para la defensa en áreas como la automatización de SOC, la detección de amenazas, la evaluación de vulnerabilidades y la respuesta a incidentes, y desarrollar experiencia con lo que funciona en sus entornos específicos», dijo Anthropic. «Y necesitamos una inversión continua en salvaguardias en todas las plataformas de IA para evitar el uso indebido de adversarios. Las técnicas que describimos hoy proliferarán en todo el panorama de amenazas, lo que hace que el intercambio de amenazas en la industria, los métodos de detección mejorados y los controles de seguridad más estrictos sean aún más críticos».

- Advertisement -[wpcode id="699"]

Leer Los empleados no aprenden nada de la capacitación en seguridad de phishing, y es por eso

¿Es importante este ataque?

Recientemente hemos visto los primeros indicadores de que los actores de amenazas en todo el mundo están explorando cómo se puede aprovechar la IA en herramientas, técnicas y ataques maliciosos. Sin embargo, anteriormente estos han estado relativamente limitados (al menos, en el ámbito público) a automatización y asistencia menores, phishing mejorado, cierta generación de código dinámico, estafas por correo electrónico y cierta ofuscación de código.

Parece que casi al mismo tiempo que el caso Anthropic, OpenAI, los creadores de ChatGPT, publicaron su propio informe, que afirmaba que hubo abuso pero poca o ninguna evidencia de que se abusara de los modelos OpenAI para obtener «capacidad ofensiva novedosa», GTG-1002 estaba ocupado implementando IA para apuntar automática y simultáneamente a organizaciones.

(Divulgación: Ziff Davis, la empresa matriz de ZDNET, presentó una demanda en abril de 2025 contra OpenAI, alegando que infringió los derechos de autor de Ziff Davis al entrenar y operar sus sistemas de IA).

Aproximadamente 30 organizaciones fueron atacadas. Sólo un pequeño número de estos ataques, «un puñado», tuvieron éxito; sin embargo, debido a alucinaciones de IA y una serie de otros problemas, incluida la fabricación de datos y mentiras descaradas sobre la obtención de credenciales válidas. Entonces, aunque sigue siendo notable, se podría argumentar que este caso es un paso adelante en las técnicas, pero aún no es el apocalipsis de la IA.

O, como dijo Anthropic, este descubrimiento «representa un cambio fundamental en la forma en que los actores de amenazas avanzadas utilizan la IA».