![]() |
Grupo de Investigación |
En un test adaptativo el ítem que se va administrar depende de los ya presentados y de las respuestas dadas a los mismos. Cada persona recibe un conjunto distinto de ítems. La medición mediante TAIs garantiza tests fiables, de administración rápida y que son muy bien aceptados por las personas. A continuación se comentan algunos de los asuntos estudiados.
Una característica de los TAIs es que repetirían la administración de los mismos ítems (los mejores disponibles), si no se introducen mecanismos correctores. Los trabajos sobre control de la exposición de los ítems proponen mecanismos correctores que garanticen la administración de la mayor parte de los ítems del banco, pero procurando al mismo tiempo que la pérdida en fiabilidad sea lo menor posible.
Los profesores Rocklin (Iowa university) y Wise (James Madison university) han propuesto los tests autoadaptados. En éstos, la persona elige un rango en el que se encontrará la dificultad del ítem que el test le administre. Algunos estudios muestran que permitir una participación activa del examinando en su evaluación tiene efectos motivacionales positivos y algunos efectos psicométricos. Nuestra investigación en este campo intenta determinar las ventajas e inconvenientes de los tests autoadaptados.
Algunas características de los ítems tienen que ver con su dificultad y otras no. Si se consigue conocer cuales son unas y otras, es posible generar isomorfos; es decir, ítems que psicométricamente son idénticos, aunque de hecho sean distintos. La Generación automática de ítems se ocupa de establecer los procedimientos que permiten generar isomorfos, comprobar que de hecho lo son, etc. Hemos trabajado en la conversión de un test tradicional a un TAI con generación automática. Hemos estudiado también la relación entre las características psicométricas de los ítems originales y sus isomorfos.
La mayor parte de la investigación actual en Teoría de los tests se enmarca en la Teoría de la respuesta al ítem (TRI). Hemos estudiado el supuesto de unidimensionalidad, y abordado la elaboración de nuevos modelos para ítems politómicos, en los que las opciones de respuestas son más de dos, como ocurre en los ítems de las escalas de actitudes o personalidad. Estos modelos permiten aplicar la TRI a los ítems que ofrecen varias categorías ordenadas (Muy de acuerdo, De acuerdo, ..) para que el examinando elija su respuesta.
Hemos desarrollado tests tradicionales (pensados para su administración en lápiz y papel, corrección manual o lectora y basados en la Teoría clásica) y tests informatizados basados en la TRI. Algunos tests se enmarcan en los que se ha venido en llamar "la nueva generación de tests", que tienen básicamente dos características: a) Los ítems se construyen teniendo en cuenta qué procedimientos, procesos, contenidos,.. han de aplicar las personas para resolverlos (y no solo buscando que difieran en dificultad), b) los ítems tienen valor diagnóstico; es decir, cuando un ítem se falla, se puede inferir a qué se debe el fallo (qué procedimiento no conoce el estudiante, qué proceso necesario para la solución correcta no ha sido aplicado,..). Hemos desarrollado tests en diversos campos. Una lista no exclusiva se ofrece a continuación:
- Visualización espacial, inteligencia, orientación espacial, razonamiento,..
- Conocimientos escolares (tests de inglés, matemáticas,..), capacidad de aprendizaje,..
- Procesos psicológicos básicos (atención, memoria, percepción,..).
- Estilos de dirección, implicación con los productos, competencias,..
Hay muy poca literatura psicométrica sobre tests multimedia, tests que apliquen realidad virtual y tests vía Internet, aunque estos últimos van apareciendo más y más, cada día. Las nuevas tecnologías plantean nuevos problemas relacionados con la "seguridad" de los ítems, la identidad de los examinados, la estandarización de las condiciones de administración y la interpretación de las puntuaciones, entre otros aspectos.
La validez de las puntuaciones de un test es un concepto relativo a su significado. Los estudios de validación han de poner a prueba hipótesis acerca del constructo que se pretende medir en el contexto de una teoría científica. En la práctica, se trata de contrastar que las puntuaciones no están contaminadas por errores sistemáticos, esto es, que no hay una parte de la varianza de las puntuaciones debida a factores irrelevantes para el constructo. En los últimos años, hemos estudiado los errores sistemáticos introducidos por algunas condiciones de los tests, tales como el tiempo de ejecución, las instrucciones y los procedimientos de puntuación, prestando especial atención al sesgo asociado al sexo.
21 - marzo - 1999,
e-mail