El modelo Rasch es un enfoque matemático y estadístico utilizado para analizar y calificar respuestas en pruebas de selección múltiple (entre ellas la prueba de Admisión de la Universidad Nacional de Colombia) y otros formatos de evaluación. Basado en el modelo desarrollado por el matemático danés Georg Rasch, este método es ampliamente usado en la evaluación educativa, psicológica y de recursos humanos debido a su capacidad para medir tanto el nivel de habilidad de los examinados como la dificultad de los ítems (preguntas) de manera independiente.
El modelo Rasch usa considera la probabilidad de que un evaluado acierte una determinada pregunta de cierta dificultad, considerando su desempeño en todas las demás preguntas, esto implica que:
- Si un evaluado falla en muchas preguntas "fáciles" (donde la gran mayoria de evaluados aciertan), pero por suerte acierta en alguna difícil, ese acierto no le generará mucho puntaje, ya que la probabilidad de que él acertara esa pregunta era baja considerando su mal desempeño en las fáciles. De esta manera se eliminan las injusticias por acertar preguntas al azar.
- Si un estudiante que ha acertado en las preguntas fáciles luego acierta en una difícil, esa pregunta le generará un alto puntaje e incrementará la probabilidad de que acierte en otras preguntas difíciles haciendo que su puntaje general se incremente.
Principales características del modelo Rasch[]
Rasch utiliza un modelo de probabilidad logística para predecir la probabilidad de que un examinado responda correctamente a una pregunta específica. La probabilidad está determinada por la habilidad del examinado y la dificultad del ítem. El modelo supone que todas las preguntas miden una única característica o habilidad (como conocimiento en matemáticas o comprensión de lectura). Esto lo diferencia de otros modelos que permiten múltiples dimensionesLa habilidad del examinado y la dificultad de las preguntas se estiman de manera separada, lo que permite comparar de manera justa a individuos y preguntas. El modelo puede identificar preguntas que no se ajustan al nivel de habilidad esperado o que no están midiendo la característica objetivo.
Los puntajes no dependen únicamente del número de respuestas correctas, sino de la relación entre la dificultad de las preguntas y la habilidad del examinado. Un examinado que responda correctamente preguntas más difíciles puede obtener una puntuación mayor que alguien que acierte solo preguntas fáciles. Al calibrar ítems con el modelo Rasch, se pueden comparar resultados de diferentes pruebas, incluso si no contienen exactamente las mismas preguntas.
Ventajas y Desventajas[]
- Objetividad: Los resultados son independientes de la muestra de examinados o del conjunto específico de ítems utilizado.
- Equidad: Permite evaluar a los participantes de manera más precisa, evitando sesgos relacionados con preguntas mal formuladas o fuera del rango de dificultad esperado.
- Flexibilidad: Puede adaptarse a una amplia variedad de pruebas y escalas de medición.
- Complejidad técnica: Requiere conocimientos estadísticos avanzados para implementar y analizar correctamente los resultados.
- Datos grandes: Es más efectivo con un tamaño de muestra grande, lo que puede ser un desafío en pruebas de baja escala.