¿Sirven las pruebas Terman para reclutamiento hoy?

Respuesta corta: Sí, pero con matices. La prueba Terman-Merrill mide capacidad intelectual general (CI) y sigue siendo un instrumento útil para inferir velocidad de aprendizaje y razonamiento, dos predictores reales del desempeño. Lo que ya no es defendible es usarla sola, sin baremos actualizados al contexto mexicano y sin combinarla con instrumentos de personalidad y competencias. El Terman no está "caducado"; está incompleto cuando se aplica como única evidencia.

Esa distinción —entre desechar un instrumento clásico y modernizar su uso— es justo lo que separa una decisión de contratación rigurosa de una basada en costumbre. A continuación respondemos las preguntas que más reciben los equipos de Recursos Humanos cuando evalúan si conservar el Terman, el Kostick o el Gordon en su batería.

¿Qué mide realmente la prueba Terman?

El Terman-Merrill es una adaptación de la escala Stanford-Binet diseñada para población adulta. Evalúa diez áreas —información, juicio, vocabulario, síntesis, concentración, análisis, abstracción, planeación, organización y atención— que en conjunto arrojan un coeficiente intelectual.

En reclutamiento no interesa el "número de CI" como etiqueta, sino lo que predice: la capacidad de aprender un puesto rápido, resolver problemas no rutinarios y procesar información compleja. La investigación en selección de personal lleva décadas mostrando que la capacidad cognitiva general es uno de los predictores más estables del desempeño laboral, sobre todo en roles de complejidad media y alta. Ahí radica la vigencia del Terman: no en su antigüedad, sino en el constructo que mide.

Entonces, ¿por qué tiene mala fama el Terman?

Por cómo se ha usado, no por lo que mide. Tres errores recurrentes explican la desconfianza:

Primero, aplicarlo con baremos viejos o importados. Un puntaje sin una tabla de referencia adecuada a la población y al puesto no significa nada. Segundo, tratar el CI como veredicto único: descartar candidatos por un número sin cruzarlo con experiencia, personalidad y ajuste al rol. Tercero, usar versiones no estandarizadas o pirateadas que circulan en internet, que invalidan cualquier interpretación seria.

Ninguno de esos problemas es culpa del instrumento. Son fallas de criterio en la aplicación, y son exactamente las que convierten una herramienta legítima en una decisión arbitraria. El fondo del asunto es siempre el mismo: sin validez demostrada y sin confiabilidad del instrumento verificada, ningún puntaje —del Terman o de cualquier prueba— soporta una decisión de contratación.

¿Y el Kostick y el Gordon? ¿Siguen vigentes?

Sí, y cumplen funciones distintas al Terman, por eso suelen ir juntos en una batería bien diseñada.

El Kostick (Papi/PAPI) mide estilo de trabajo y motivaciones laborales: cómo prefiere trabajar la persona, su orientación al logro, su forma de relacionarse y de tomar decisiones. No mide capacidad, mide comportamiento preferido en el entorno laboral.

El Gordon (perfil-inventario de personalidad) evalúa rasgos como ascendencia, responsabilidad, estabilidad emocional y sociabilidad, además de variables como cautela, originalidad y relaciones personales.

La lógica de combinarlos es simple: el Terman dice qué tan rápido puede aprender y razonar alguien, mientras el Kostick y el Gordon dicen cómo va a comportarse y qué lo motiva. Capacidad sin ajuste conductual predice mal; ajuste sin capacidad, también. Juntos cubren dimensiones complementarias.

¿Es válido aplicar el Terman en línea hoy?

Puede serlo, siempre que se cumplan condiciones de control. La aplicación digital no degrada la validez del instrumento por sí misma; lo que la pone en riesgo es la falta de supervisión, los tiempos no controlados y las versiones no estandarizadas.

Una aplicación en línea válida exige: control de tiempo por sección, medidas contra la consulta externa, baremos calibrados y un reporte que interprete resultados, no que solo arroje un número. Si la plataforma garantiza esas condiciones, el formato digital es tan defendible como el presencial y mucho más eficiente.

¿Cuándo conviene usar el Terman y cuándo no?

Conviene cuando el puesto exige aprendizaje continuo, resolución de problemas o manejo de información compleja: roles técnicos, analíticos, de supervisión o de toma de decisiones. En esos casos, la capacidad cognitiva aporta información predictiva difícil de obtener por entrevista.

Conviene menos como filtro único en puestos donde el desempeño depende sobre todo de habilidades específicas, actitud de servicio o destreza manual. Ahí el peso debe recaer en pruebas de competencias y en evaluaciones de personalidad, con el Terman como dato secundario, no como puerta de entrada.

La regla práctica: el Terman es un insumo dentro de una batería, nunca la batería completa.

¿Qué hace que una batería con Terman sea defendible en 2026?

Tres condiciones. Baremos actualizados y pertinentes a la población mexicana y al tipo de puesto. Integración con instrumentos de personalidad y competencias, de modo que ninguna decisión dependa de una sola prueba. E interpretación profesional: un reporte leído por alguien que entiende qué predice cada constructo y qué no.

Modernizar el uso de los instrumentos clásicos no significa reemplazarlos por lo último que aparezca en el mercado. Significa aplicarlos con el rigor metodológico que su construcción original ya contemplaba: estandarización, validez y confiabilidad. El Terman, el Kostick y el Gordon no compiten con la psicometría moderna; bien usados, son parte de ella.

Un ejemplo de este principio es Ciesman, la adaptación de Psicotest basada en el constructo del Terman, construida con baremos para población mexicana y aplicación estandarizada en línea. No reemplaza la lógica de batería: mide capacidad cognitiva general y se integra con instrumentos de personalidad y competencias, que es exactamente lo que distingue un uso defendible de uno por costumbre.

En resumen

El Terman sirve para reclutamiento hoy si se usa como lo que es: una medida de capacidad cognitiva general, con baremos vigentes, integrada en una batería que incluya personalidad y competencias, e interpretada por un profesional. Descartarlo por viejo es tan poco riguroso como aplicarlo como veredicto absoluto. La diferencia entre ambos extremos es criterio, y el criterio es lo que distingue una contratación basada en evidencia de una basada en costumbre.

‍

Ciencia con conciencia

¿Sirven las pruebas Terman para reclutamiento hoy?

¿Qué mide realmente la prueba Terman?

Entonces, ¿por qué tiene mala fama el Terman?

¿Y el Kostick y el Gordon? ¿Siguen vigentes?

¿Es válido aplicar el Terman en línea hoy?

¿Cuándo conviene usar el Terman y cuándo no?

¿Qué hace que una batería con Terman sea defendible en 2026?

En resumen

Publicaciones similares

Aurora Martínez

¿Cuánto cuesta aplicar pruebas psicométricas en línea para una empresa?

Aurora Martínez

¿Puede la inteligencia artificial sustituir una prueba psicométrica en un proceso de reclutamiento?

Aurora Martínez

Screening con IA vs. evaluación psicométrica: el riesgo que no ves

Comienza a usar Psicotest desde hoy

Ciencia con conciencia

¿Sirven las pruebas Terman para reclutamiento hoy?

¿Qué mide realmente la prueba Terman?

Entonces, ¿por qué tiene mala fama el Terman?

¿Y el Kostick y el Gordon? ¿Siguen vigentes?

¿Es válido aplicar el Terman en línea hoy?

¿Cuándo conviene usar el Terman y cuándo no?

¿Qué hace que una batería con Terman sea defendible en 2026?

En resumen

Aurora Martínez

Gerente de investigación

Psicotest

Publicaciones similares

Aurora Martínez

¿Cuánto cuesta aplicar pruebas psicométricas en línea para una empresa?

Aurora Martínez

¿Puede la inteligencia artificial sustituir una prueba psicométrica en un proceso de reclutamiento?

Aurora Martínez

Screening con IA vs. evaluación psicométrica: el riesgo que no ves

Comienza a usar Psicotest desde hoy