Confiabilidad

Definición. La confiabilidad de una prueba psicométrica es el grado en que sus resultados son consistentes y libres de error aleatorio — es decir, en qué medida la prueba mide algo de forma estable, independientemente del momento, del aplicador o del subconjunto de ítems usados.

Desarrollo. Confiabilidad y validez son conceptos distintos. Una prueba puede ser muy confiable y poco válida — mide algo de forma muy consistente, pero no mide lo que dice medir. La validez sin confiabilidad es imposible; la confiabilidad sin validez es frecuente y peligrosa, porque produce resultados aparentemente sólidos que no significan lo que parecen.

Existen varios tipos de confiabilidad, cada uno con su método estadístico:

Test-retest: estabilidad de los puntajes en el tiempo.
Consistencia interna: coherencia entre ítems del mismo factor (Alfa de Cronbach, Omega de McDonald).
Confiabilidad entre evaluadores: acuerdo entre distintas personas que califican.
Formas paralelas: equivalencia entre dos versiones del mismo instrumento.

Los coeficientes se expresan en una escala de 0 a 1. Para decisiones individuales de alto impacto — selección, promoción — se recomienda coeficientes por encima de 0.80. Para tamizaje grupal, 0.70 puede ser aceptable.

Ejemplo aplicado. Una empresa de manufactura en el Bajío aplica a 300 candidatos a operador de línea una prueba de razonamiento mecánico. El proveedor reporta un Alfa de Cronbach de 0.87 en la escala principal. Dos semanas después, el coordinador de reclutamiento decide reaplicar la prueba a 30 candidatos finalistas para confirmar puntajes antes de la oferta. Los puntajes de la segunda aplicación correlacionan 0.84 con los de la primera. Las dos cifras juntas — consistencia interna alta y estabilidad test-retest alta — dan al coordinador la confianza técnica de que las diferencias entre candidatos finalistas reflejan diferencias reales en la habilidad evaluada, no ruido de medición. Sin esos coeficientes documentados, el proceso habría tomado decisiones individuales sobre puntajes cuya estabilidad nadie podía garantizar.

Por qué importa al decisor. Pedir el coeficiente de confiabilidad de cada escala de una prueba es legítimo y necesario. Un proveedor profesional lo tiene documentado y lo entrega sin reservas. La ausencia de esa información es, por sí sola, una señal.

‍

Referencias.

American Educational Research Association, American Psychological Association, & National Council on Measurement in Education. (2014). Standards for educational and psychological testing. American Educational Research Association.
Cho, E., & Kim, S. (2015). Cronbach's coefficient alpha: Well known but poorly understood. Organizational Research Methods, 18(2), 207-230. https://doi.org/10.1177/1094428114555994
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16(3), 297-334. https://doi.org/10.1007/BF02310555
McDonald, R. P. (1999). Test theory: A unified treatment. Lawrence Erlbaum.

‍

Confiabilidad

Más términos para explorar