El envenenamiento de datos introduce sesgo intencional en el conjunto de datos de entrenamiento y esto cambia el punto de partida de los algoritmos. Foto: Usnplash.

Envenenamiento por IA: el proceso que sirve para difundir información falsa y dañina que parece completamente normal

Por: Redacción redaccion@eluniverso.com

22 de octubre, 2025 - 05h05

Un estudio conjunto del Instituto de Seguridad de IA del Reino Unido, el Instituto Alan Turing y Anthropic descubrió que insertar archivos maliciosos puede causar envenenamiento de la Inteligencia Artificial (IA), lo que conlleva a que modelos como ChatGPT y Claude difundan información falsa y dañina.

El resultado de este estudio se publicó a principios de octubre de 2025 y en él se detalla qué es un envenenamiento por IA y por qué supone un riesgo de ciberseguridad, según indica Science Alert.

OpenAI presenta ‘Atlas’, un navegador con inteligencia artificial que busca competir con Google Chrome

¿Qué es el envenenamiento por IA?

“El envenenamiento de datos de IA es un intento deliberado de introducir sesgo en los datos de entrenamiento de un modelo de IA para que sus resultados estén sesgados”, explica Cloudflare. Ocurre “cuando un atacante manipula los resultados de un modelo de IA o aprendizaje automático modificando sus datos de entrenamiento”.

Alguien podría alterar los datos de un modelo de IA para que mienta o engañe a sus usuarios. Foto: Pexels.

En otras palabras, se refiere al proceso de enseñar a un modelo de IA lecciones erróneas a propósito, lo que provocará un rendimiento deficiente, funciones maliciosas y errores específicos. A esta manipulación también se le conoce como envenenamiento de datos.

Juez usa IA para dictar una condena, el fallo es anulado tras ser descubierto

De acuerdo con la publicación de Science Alert existen dos tipos de envenenamiento de datos:

Ataques directos o dirigidos: modifican la salida de un modelo en respuesta a una consulta específica
Ataques indirectos o no dirigidos: estos buscan degradar el rendimiento general del modelo

Un modelo envenenado también podría generar más riesgos de ciberseguridad para los usuarios ya que a través de él se puede difundir información falsa y dañina mientras parece completamente normal.

Science Alert usa como ejemplo la suposición de que un atacante quiere que el modelo de IA crea que “comer lechuga cura el cáncer”.

Para ello “podría crear una gran cantidad de páginas web gratuitas que lo presenten como un hecho”. En caso de que el modelo extraiga datos de estas páginas “podría empezar a tratar esta información errónea como un hecho y repetirla cuando un usuario pregunte sobre el tratamiento del cáncer”.

(I)

Envenenamiento por IA: el proceso que sirve para difundir información falsa y dañina que parece completamente normal

¿Qué es el envenenamiento por IA?

Te recomendamos estas noticias