
los detectores de IA no son fiables en la universidad
Un equipo de la Universidad de Florida probó los cinco detectores de texto más usados en el mercado con alrededor de 6 000 trabajos de investigación reales, creados antes de que apareciera ChatGPT.
Los resultados mostraron que los falsos positivos variaron entre 0,05 % y 68,6 %, mientras que los falsos negativos oscilaron entre 0,3 % y 99,6 %, es decir, algunos detectores dejaron pasar casi todo el texto generado por IA.
Además, cuando los textos fueron reescritos con vocabulario más complejo, dos de los detectores dejaron de funcionar, lo que pone en riesgo decisiones que pueden afectar la carrera de estudiantes y investigadores.
los números que sorprenden a todos
Los cinco detectores analizados tuvieron una tasa de falsos positivos que llegó hasta 68,6 % y una tasa de falsos negativos que alcanzó casi 100 % en algunos casos.
Esto significa que, según el detector, trabajos originales pueden ser marcados como IA y, al revés, textos generados por IA pueden pasar desapercibidos.
el truco que engaña a los detectores
Los investigadores pidieron a los modelos de lenguaje que reescribieran los textos usando un vocabulario más complejo, lo que llamaron un ataque de complejidad léxica. Tras este proceso, dos detectores dejaron de identificar el contenido como generado por IA.
Este método demuestra que los sistemas actuales son vulnerables a simples cambios de estilo.
por qué tu futuro académico está en juego
Una acusación de uso de IA puede dañar la reputación de un estudiante o investigador, y con estos resultados poco fiables, confiar ciegamente en los detectores es arriesgado.
Las instituciones deben buscar pruebas más sólidas antes de tomar decisiones que puedan afectar carreras y publicaciones.
