Definición. La confiabilidad de una prueba psicométrica es el grado en que sus resultados son consistentes y libres de error aleatorio — es decir, en qué medida la prueba mide algo de forma estable, independientemente del momento, del aplicador o del subconjunto de ítems usados.
Desarrollo. Confiabilidad y validez son conceptos distintos. Una prueba puede ser muy confiable y poco válida — mide algo de forma muy consistente, pero no mide lo que dice medir. La validez sin confiabilidad es imposible; la confiabilidad sin validez es frecuente y peligrosa, porque produce resultados aparentemente sólidos que no significan lo que parecen.
Existen varios tipos de confiabilidad, cada uno con su método estadístico:
Los coeficientes se expresan en una escala de 0 a 1. Para decisiones individuales de alto impacto — selección, promoción — se recomienda coeficientes por encima de 0.80. Para tamizaje grupal, 0.70 puede ser aceptable.
Ejemplo aplicado. Una empresa de manufactura en el Bajío aplica a 300 candidatos a operador de línea una prueba de razonamiento mecánico. El proveedor reporta un Alfa de Cronbach de 0.87 en la escala principal. Dos semanas después, el coordinador de reclutamiento decide reaplicar la prueba a 30 candidatos finalistas para confirmar puntajes antes de la oferta. Los puntajes de la segunda aplicación correlacionan 0.84 con los de la primera. Las dos cifras juntas — consistencia interna alta y estabilidad test-retest alta — dan al coordinador la confianza técnica de que las diferencias entre candidatos finalistas reflejan diferencias reales en la habilidad evaluada, no ruido de medición. Sin esos coeficientes documentados, el proceso habría tomado decisiones individuales sobre puntajes cuya estabilidad nadie podía garantizar.
Por qué importa al decisor. Pedir el coeficiente de confiabilidad de cada escala de una prueba es legítimo y necesario. Un proveedor profesional lo tiene documentado y lo entrega sin reservas. La ausencia de esa información es, por sí sola, una señal.
Referencias.