Siete de 33 jerarcas policiales no aprobaron el polígrafo. El dato parece contundente: 21%.

Pero, desde la estadística, esa cifra no responde la pregunta más importante: ¿cuántos de esos siete son verdaderos casos de riesgo y cuántos podrían ser falsos positivos? Toda prueba de clasificación tiene errores.

La sensibilidad mide la capacidad de identificar correctamente a quienes sí tienen la condición buscada. La especificidad mide la capacidad de identificar correctamente a quienes no la tienen.

En este caso, la condición no es tener fiebre ni colesterol alto, sino algo mucho más difícil de observar: vínculos con crimen organizado, narcotráfico o beneficios ilícitos. Ese salto importa.

El polígrafo no mide corrupción. Mide respuestas fisiológicas: respiración, sudoración, pulso, presión.

Luego alguien interpreta si esos cambios son compatibles con engaño. Es decir, el resultado no es una medición directa de la mentira, sino una inferencia sobre una inferencia.

Supongamos, para ilustrar, una prueba con 85% de sensibilidad y 85% de especificidad. Suena bastante bien.

Pero, aplicada a 33 personas, si ninguna tuviera vínculos reales, podría generar cerca de cinco falsos positivos por error de clasificación. Y si la prevalencia real fuera de 5%, esperaría detectar apenas uno o dos casos verdaderos, junto con varios falsos positivos.

Por eso, cuando se busca un evento poco frecuente, una prueba imperfecta puede generar más sospechas que certezas. Aquí entra otro concepto psicométrico: la validez.

Una prueba puede ser relativamente confiable, es decir, producir resultados consistentes y, aun así, no ser válida para aquello que se quiere decidir. Si mide activación fisiológica, pero la decisión es remover a una persona por sospechas de infiltración criminal, el puente entre medición y conclusión debe ser muy sólido.

En el caso del polígrafo, ese puente es frágil. El informe The Polygraph and Lie Detection (2003), de la National Academy of Sciences, hizo una distinción clave: no es lo mismo usar el polígrafo para investigar un hecho específico que aplicarlo como filtro general de confianza.

En un hecho concreto, hay un evento y un criterio más claro para juzgar la verdad. En un tamizaje de personal, las preguntas son más ambiguas y la precisión esperada es menor.

Quince años después, Current Status of Forensic Lie Detection with the Comparison Question Technique (2019), de William Iacono y Gershon Ben-Shakhar, remarcó que las advertencias seguían vigentes: la base científica era débil, las afirmaciones de alta precisión no estaban justificadas y la tasa real de error seguía siendo incierta. La conclusión no es que no se investigue.

Es exactamente lo contrario. La infiltración criminal exige controles patrimoniales, auditorías, trazabilidad de accesos, contrainteligencia, investigación financiera y debido proceso.

El polígrafo podría ser una señal inicial. Pero una señal estadísticamente incierta no debería convertirse, por sí sola, en sentencia administrativa ni reputacional.affa17@gmail.com Andrés Fernández Arauz es economista.