Cómo funciona el algoritmo del GMAT
Un algoritmo es un conjunto prescrito de instrucciones o reglas bien definidas, ordenadas y finitas que son seguidas para resolver un problema.
El GMAT emplea un algoritmo tipo CAT que pretende estimar de manera fiable y eficiente la habilidad de un estudiante en una cantidad razonable de tiempo. Algunos algoritmos CAT tratan de conseguir esto seleccionando una pregunta cada vez, dependiendo de las anteriores respuestas del estudiante. Otros algoritmos sólo atienden a la última pregunta contestada.
Los algoritmos CAT también varían en función del criterio usado para elegir la siguiente pregunta. Algunos tratan de minimizar el error de medición total, otros intentan maximizar la precisión y la exactitud de cada pregunta administrada según la respuesta de cada usuario y otros se centran en la estimación de las capacidades de cada individuo. Como consecuencia los algoritmos CAT pueden variar mucho de unos a otros, dependiendo de la implementación específica del algoritmo y de la intención de los desarrolladores, sin embargo todos coinciden en su fin; que es reducir lo máximo posible las preguntas que un alumno debe responder para obtener datos fiables sobre sus grados de competencia y habilidad. Mediante los análisis lineales como el del LSAT se necesita un mayor número de preguntas para alcanzar un alto grado de fiabilidad de los resultados, unas 100 aproximadamente, sin embargo el algoritmo empleado en el GMAT permite alcanzar resultados constatables con menos de 80 cuestiones.
¿Todo el GMAT es adaptativo?
Casi todas las pruebas estandarizadas a gran escala contienen una serie de preguntas “experimentales” o de “prueba” que realmente no influyen en el resultado final del examen. Estas cuestiones sirven para obtener datos que permitan diferenciar a cada individuo dentro de su conjunto según sus respuestas y su habilidad para sortearlas; son una baza empleada por los correctores para diferenciar entre cada examinado y obtener mayor información de su situación.
Estas preguntas se presentan en diferentes partes del examen según la prueba en sí, en el LSAT aparecen perfectamente diferenciadas en un aparatado dedicado únicamente a ellas justo antes del comienzo de la prueba pero sin embargo en el GMAT estas preguntas aparecen entremezcladas con las operativas (es decir las que puntúan) quedando en muchas ocasiones entre los examinados la duda de cuál es la prueba que puntúa y cuál no. Hay que destacar esforzarse por tratar de averiguarlo suele ser una pérdida de energía y esfuerzo que no da buenos resultados.
¿Cómo se seleccionan las preguntas del GMAT?
Los CAT como el GMAT tienen un punto de partida, un conjunto de especificaciones (dificultad, tipo de pregunta, área de contenido, etc.) que definen qué preguntas figurarán en el mismo. Al mismo tiempo cada pregunta tiene ciertas características estadísticas que el algoritmo usa, basándose en las respuestas obtenidas, para estimar su capacidad de valorar verbal o cuantitativamente. El algoritmo analiza las preguntas que ya tienen respuesta y luego recogen las características del resto seleccionando finalmente las cuestiones que mejor satisfagan su plan de acción y que mayor cantidad de información estadística ofrezcan. Así se recogen las mejores preguntas, aquellas que ofrecen la mayor fiabilidad sobre las competencias examinadas.
Mi puntuación no parece coincidir con mi actuación: sólo hice una pregunta mal, pero mi puntuación no es tan alta como pensé que sería / Me equivoqué en un montón de preguntas, pero mi puntuación parece mayor de lo que debería.
La mayoría de los exámenes emplean una valoración lineal en la que se estipula el resultado a partir de los aciertos y errores cometidos; no obstante el GMAT no funciona así. El CAT no tiene en cuenta “cuántas” preguntas fallas o aciertas si no “cuáles”. Cada pregunta tiene un grado de dificultad que se tiene en cuenta a la hora de determinar su puntuación y que estima la capacidad del examinado mediante una variedad de criterios. Tras realizar una pregunta se evalúa su respuesta y se actualiza la estimación de la misma. Una vez finalizado el examen el algoritmo convierte tu puntuación en materia cuantitativa y verbal; luego añade la habilidad de los mismos criterios que sumados forman el resultado final. Es decir existe la puntuación pero está entrelazada con la dificultad adyacente de la pregunta y la habilidad de cada uno al realizarla.
¿Las primeras preguntas puntúan más?
Esta pregunta tiene una sencilla respuesta, aunque existen cuestiones con un mayor grado de dificultad que otras y su grado de estimación en capacidades puede parecer más notorio, todas las preguntas deben considerarse cómo significativamente importantes.
El hecho de dejar dos preguntas “fáciles” pone en evidencia las capacidades del examinado y lo mismo pasa con las “difíciles”, sin embargo cada una tiene unas características estadísticas y de habilidad que conforman una compleja valoración de resultados. Es mejor dejar una pregunta difícil sin contestar que una fácil por su factor de complejidad, sin embargo tratar de dilucidar qué preguntas son más sencillas y cuáles no no trae resultados satisfactorios ya que todas deben ser tenidas en cuenta según las circunstancias.
¿Es muy grave no terminar una sección?
La pena es significativa ya que el resultado en escala puede disminuir en aproximadamente 1 punto por cada pregunta que no se responde. Por ejemplo aunque contestes todas las preguntas del test salvo las cinco últimas generalmente la puntuación no supera un 46.
¿Cómo puede ser la puntuación general ser superior a las puntuaciones tanto verbales y cuantitativas?
La puntación total se calcula por separado respecto a las notas de sección, por lo que se pude sacar un percentil 99 incluso cuando no se saca en cualquiera de las secciones.
¿Por qué es tan difícil crear un buen CAT?
Un CAT necesita controlar numerosos factores para que se considere fiable a la hora de precisar habilidades y competencias. Requiere de un algoritmo robusto para estimar su capacidad de acción, un mecanismo complejo pero rápido para identificar las preguntas más importantes para los destinatarios que realicen la prueba, una rica variedad de cuestiones entre las que poder escoger y un algoritmo de puntuación competente que permita traducir los datos en estimaciones fiables sobre las competencias del examinado.
Durante la selección de cada pregunta en las pruebas existen muchas características que necesitan ser consideradas. Por ejemplo los resultados estadísticos de todas las cuestiones son determinados previamente a través de un proceso conocido como pretesting. Las preguntas son fundamentales para poder proporcionar una evaluación precisa de todos los niveles de habilidad y por ello deben ser cuidadosamente construidas, revisadas y estadísticamente alineadas para que contribuyan correctamente mediante estimaciones.
Fuente: knewton.com
There are no comments at the moment, do you want to add one?
Write a comment