Qué significa que una prueba psicométrica "esté validada" (y cómo comprobarlo)

"Está validada" es probablemente la frase más repetida en una venta de psicometría laboral, y la que menos se examina. Suena a garantía, pero por sí sola no dice nada verificable. Validar una prueba no es obtener un sello permanente: es sostener un argumento con evidencia, para una población y un uso específicos. Una misma prueba puede ser válida para un propósito e inválida para otro, válida en un país y dudosa en otro, válida hace veinte años y no hoy.

Por eso la pregunta útil no es si una prueba está validada, sino con qué muestra, con qué población y para qué decisión. Lo que sigue resume lo esencial. El desarrollo completo, con umbrales numéricos y las doce preguntas clave para tu proveedor, está en nuestra guía técnica.

¿Qué es la validez en una prueba psicométrica?

Los estándares internacionales que rigen la materia —elaborados por la American Educational Research Association, la American Psychological Association y el National Council on Measurement in Education (AERA, APA y NCME, 2014)— definen la validez como el grado en que la evidencia y la teoría sustentan las interpretaciones de las puntuaciones de un test para los usos propuestos.

La idea clave es que la validez no es una propiedad del test, sino de la interpretación que se hace de sus resultados, en una población concreta. Como señalan Prieto y Delgado (2010), es un malentendido frecuente atribuir la validez al instrumento en sí; corresponde a las inferencias y usos de las medidas. Por eso validar es un verbo en presente continuo: si la muestra deja de representar a la población actual o los criterios del puesto cambian, el argumento de validez se debilita con ellos. Lo desarrollamos a fondo en validez en psicometría laboral.

¿No basta con que la prueba "parezca" seria?

No, y aquí está el error más común. La validez aparente es el grado en que una prueba parece apropiada para lo que dice medir: preguntas que hablan de liderazgo, un cuestionario denso, un puntaje al final. El problema es que parecer relevante no predice nada sobre el valor predictivo real. Instrumentos con altísima validez aparente pueden predecir el desempeño laboral mucho peor que otros que parecen abstractos (Sackett, Zhang, Berry y Lievens, 2022). La apariencia da confianza, pero no sostiene una decisión.

¿Qué tipos de evidencia debe poder mostrar un proveedor?

La validez no es un solo bloque, sino un conjunto de evidencias. Las principales son la validez de contenido (¿los ítems se diseñaron a partir de un análisis del puesto real?), la validez de constructo (¿la prueba mide el atributo psicológico que dice medir y no otra cosa?) y la validez de criterio (¿el puntaje predice efectivamente el desempeño posterior?). Esta última es la que demuestra que una prueba sirve para tomar decisiones de contratación, y los metaanálisis más recientes han revisado a la baja los coeficientes que se citaron durante décadas (Sackett et al., 2022; Schmidt y Hunter, 1998).

¿Y la confiabilidad? ¿Es lo mismo?

No. La confiabilidad es la consistencia de la medición: no si la prueba mide lo correcto, sino si lo mide con precisión. Su relación con la validez es jerárquica: una prueba puede ser muy confiable y medir algo irrelevante, pero una prueba poco confiable nunca puede tener alta validez. Para decisiones que afectan a una persona —contratar, promover— el coeficiente de confiabilidad recomendado por la literatura no es 0.70, sino al menos 0.90 (Prieto y Delgado, 2010; Nunnally, 1978). Si un proveedor presenta coeficientes entre 0.70 y 0.80 como suficientes para selección, está aplicando un estándar equivocado. Esta y otras confusiones frecuentes las aclaramos en confusiones sobre confiabilidad en pruebas psicométricas.

¿Una prueba validada en otro país sirve igual en México?

No se puede asumir; hay que probarlo. Traducir un test no es adaptarlo: la traducción es solo lengua, mientras que la adaptación implica revisar la equivalencia del constructo, pilotar y revalidar sobre la población destino (International Test Commission, 2017). Sin ese trabajo, las puntuaciones se comparan contra tablas de otra población, y un candidato calificado puede ser rechazado de forma sistemática solo por el sesgo de las normas. En México esto tiene además una arista legal: la discriminación se configura "con intención o sin ella", de modo que un instrumento no validado para la población local puede producir un resultado discriminatorio aunque nadie lo haya buscado.

Lo esencial

"Está validada" no es una garantía; es el inicio de una conversación. Un proveedor serio puede mostrar con qué población se construyeron sus normas, cuándo se actualizaron, qué coeficientes reporta y qué evidencia de equidad tiene. Quien responde con generalidades está diciendo algo importante sobre lo que vende. Si quieres distinguir lo que sí es reclutamiento científico de lo que solo lo aparenta, lo abordamos en reclutamiento científico: qué es y qué no.

Reunimos todo esto, y más, en una guía técnica que ya está disponible para lectura y descarga. La escribimos para que tomes decisiones con más información. Consulta la guía técnica completa aquí.

Referencias

American Educational Research Association, American Psychological Association, & National Council on Measurement in Education. (2014). Standards for educational and psychological testing. AERA.

International Test Commission. (2017). The ITC guidelines for translating and adapting tests (2nd ed.). https://doi.org/10.1080/15305058.2017.1398166

Nunnally, J. C. (1978). Psychometric theory (2nd ed.). McGraw-Hill.

Prieto, G., & Delgado, A. R. (2010). Fiabilidad y validez. Papeles del Psicólogo, 31(1), 67–74.

Sackett, P. R., Zhang, C., Berry, C. M., & Lievens, F. (2022). Revisiting meta-analytic estimates of validity in personnel selection: Addressing systematic overcorrection for restriction of range. Journal of Applied Psychology, 107(11), 2040–2068. https://doi.org/10.1037/apl0000994

Schmidt, F. L., & Hunter, J. E. (1998). The validity and utility of selection methods in personnel psychology: Practical and theoretical implications of 85 years of research findings. Psychological Bulletin, 124(2), 262–274. https://doi.org/10.1037/0033-2909.124.2.262

‍

Ciencia con conciencia

Qué significa que una prueba psicométrica "esté validada" (y cómo comprobarlo)

¿Qué es la validez en una prueba psicométrica?

¿No basta con que la prueba "parezca" seria?

¿Qué tipos de evidencia debe poder mostrar un proveedor?

¿Y la confiabilidad? ¿Es lo mismo?

¿Una prueba validada en otro país sirve igual en México?

Lo esencial

Referencias

Publicaciones similares

Aurora Martínez

Qué significa que una prueba psicométrica "esté validada" (y cómo comprobarlo)

Rubén Ruiz

¿Qué herramienta de pruebas psicométricas es adecuada para una empresa pequeña sin área de RR.HH.?

Aurora Martínez

¿Para qué sirve aplicar pruebas psicométricas antes de contratar a alguien?

Comienza a usar Psicotest desde hoy

Ciencia con conciencia

Qué significa que una prueba psicométrica "esté validada" (y cómo comprobarlo)

¿Qué es la validez en una prueba psicométrica?

¿No basta con que la prueba "parezca" seria?

¿Qué tipos de evidencia debe poder mostrar un proveedor?

¿Y la confiabilidad? ¿Es lo mismo?

¿Una prueba validada en otro país sirve igual en México?

Lo esencial

Referencias

Aurora Martínez

Gerente de investigación

Psicotest

Publicaciones similares

Aurora Martínez

Qué significa que una prueba psicométrica "esté validada" (y cómo comprobarlo)

Rubén Ruiz

¿Qué herramienta de pruebas psicométricas es adecuada para una empresa pequeña sin área de RR.HH.?

Aurora Martínez

¿Para qué sirve aplicar pruebas psicométricas antes de contratar a alguien?

Comienza a usar Psicotest desde hoy