Definición. El funcionamiento diferencial del ítem, conocido como DIF (Differential Item Functioning), es el fenómeno estadístico que ocurre cuando un ítem específico de una prueba se comporta de manera distinta en dos grupos comparables — por ejemplo, hombres y mujeres, o personas de distinta región — aún cuando los individuos de ambos grupos tienen el mismo nivel en el constructo que la prueba pretende medir.
Desarrollo. El DIF es la forma más operacionalizable y estadísticamente rigurosa de detectar sesgo de ítem en pruebas psicométricas. Su lógica conceptual es directa: si dos personas tienen exactamente la misma capacidad real en el constructo evaluado, deberían tener la misma probabilidad de responder correctamente a cualquier ítem específico de la prueba — independientemente de su género, edad, región o cualquier otra característica demográfica. Cuando esa probabilidad difiere sistemáticamente, el ítem está funcionando de manera diferencial.
Los métodos estadísticos estándar para detectar DIF incluyen:
Una distinción técnica importante: el DIF detectado estadísticamente no es automáticamente "sesgo" en sentido pleno. Se distingue entre DIF (diferencia estadística observada) e impacto adverso (consecuencia práctica de esa diferencia). Un ítem con DIF estadístico puede o no traducirse en sesgo sustantivo según el constructo, la magnitud de la diferencia y el uso que se haga del instrumento. La interpretación técnica del DIF requiere juicio sustantivo además de análisis estadístico.
Cuando se detecta DIF en un ítem, las opciones prácticas son: revisar el ítem para identificar la fuente potencial del funcionamiento diferencial (lenguaje, contexto cultural, formato), modificarlo si la fuente es identificable, o eliminarlo y sustituirlo. La revisión periódica de los instrumentos para detectar y corregir DIF es práctica estándar de mantenimiento técnico de pruebas profesionales.
Ejemplo aplicado. Un proveedor de pruebas psicométricas para uso laboral en México realiza, como parte de su proceso de mantenimiento técnico anual, un análisis de DIF en su batería principal de competencias laborales. Sobre una muestra de 4,800 evaluados aplica el procedimiento Mantel-Haenszel con dos agrupaciones: género y nivel educativo. El análisis identifica tres ítems con DIF significativo por género en una escala de "comunicación efectiva" y dos ítems con DIF por escolaridad en una escala de "razonamiento aplicado". El equipo psicométrico revisa cualitativamente cada ítem, identifica las fuentes probables del funcionamiento diferencial — lenguaje técnico no estandarizado en los ítems de razonamiento, ejemplos contextuales en los ítems de comunicación — y reescribe los cinco ítems. La nueva versión se valida en muestra independiente antes de incorporarse a la versión vigente del instrumento.
Por qué importa al decisor. Que un proveedor realice análisis periódicos de DIF y los reporte públicamente es una de las señales más fuertes de calidad técnica y compromiso con la equidad. Solicitar esta información a los proveedores es legítimo y, en muchos contextos regulatorios contemporáneos, esperable como parte del manual técnico.
Referencias.