Definición. El Test de Terman-Merrill es una versión del Stanford-Binet desarrollada en la primera mitad del siglo XX como prueba de inteligencia general individual. Originada para evaluación clínica e infantil en Estados Unidos, se popularizó en México en el siglo XX como instrumento aplicado en procesos de selección laboral para estimar capacidad cognitiva en candidatos adultos.
Desarrollo. El instrumento original de Terman fue, en su contexto histórico, una contribución significativa a la psicometría de la inteligencia. Sus problemas en uso laboral mexicano contemporáneo no son del instrumento como tal, sino de las condiciones específicas en que se ha aplicado durante décadas en este país: con baremos antiguos, frecuentemente derivados de poblaciones distintas a la mexicana adulta laboral, sin la calibración estadística necesaria para el contexto donde se usa.
Las dificultades técnicas específicas que la literatura aplicada documenta son tres. Primera, el envejecimiento de los baremos: el efecto Flynn implica que los puntajes en pruebas de inteligencia tienden a aumentar generación tras generación, lo que vuelve obsoletos los baremos no actualizados periódicamente. Segunda, la población de referencia: el instrumento se diseñó originalmente con propósito de evaluación clínica infantil; su aplicación a adultos en contextos de selección laboral requiere estandarización específica para esa población. Tercera, el propósito de uso: la inteligencia clínica que el instrumento original buscaba diagnosticar y la inteligencia laboral que se busca predecir en selección son constructos cercanos pero no idénticos, y la evidencia de validez de criterio para selección debe construirse específicamente para ese uso.
La postura técnicamente sólida no es que "el Terman ya no debe usarse". Es que cualquier instrumento basado en la tradición Terman-Stanford-Binet aplicado en México hoy debe demostrar tres cosas: estandarización vigente con muestra mexicana adulta laboral representativa, evidencia documentada de validez de criterio para el tipo de puesto donde se aplica, y manual técnico actualizado disponible para revisión. Instrumentos modernos inspirados en la tradición de medición de inteligencia general que cumplen estos requisitos son técnicamente defendibles. Los que se aplican por inercia, sin documentación técnica vigente, no.
Ejemplo aplicado. Una empresa mexicana con presencia nacional revisa la batería que aplica desde hace 15 años a candidatos a posiciones administrativas. Encuentra que sigue usando un Terman con baremos de hace tres décadas, derivados de población no claramente documentada. La directora de RRHH no descarta la idea de evaluar capacidad cognitiva — sigue siendo predictor útil — pero exige al proveedor evidencia técnica vigente. El proveedor presenta dos opciones: actualizar la calibración local del instrumento existente con muestra adulta laboral mexicana representativa de los últimos cinco años, o migrar a una prueba de capacidad cognitiva general diseñada específicamente para selección laboral con baremos mexicanos recientes. La decisión correcta no es contra el instrumento clásico; es exigir la documentación técnica que cualquier instrumento contemporáneo debe poder mostrar.
Por qué importa al decisor. Aplicar pruebas por inercia, sin revisar la vigencia de sus baremos ni la disponibilidad de su manual técnico, es uno de los hábitos más comunes y más cuestionables del reclutamiento mexicano. La pregunta operativa no es "¿debo dejar de usar este instrumento?" sino "¿cuenta este instrumento con la documentación técnica vigente que justifica su uso para esta decisión?". Si la respuesta es no, el problema es la documentación, no el instrumento.
Referencias.