Los exámenes son un método bien establecido para evaluar el rendimiento académico; tanto académicos como estudiantes suelen confiar en que son una medida válida y fiable del rendimiento. A las instituciones académicas les gusta su eficacia a la hora de realizarlos y calificarlos, y el hecho de que facilitan una medición objetiva, fácilmente documentada y estandarizada. Los estudiantes se sienten seguros con el formato de un examen; en el Reino Unido y en muchos otros contextos, los estudiantes habrán realizado exámenes a lo largo de sus años escolares y estarán bien versados y, en ocasiones, serán muy hábiles en el arte de comprender lo que se exige de un examen y demostrar precisamente eso, y nada superfluo a ello.
Sin embargo, al mismo tiempo y cada vez más en los últimos años, los exámenes también han sido objeto de escrutinio y críticas por reforzar las desigualdades, carecer de autenticidad en cuanto a lo que se espera que hagan los estudiantes en sus futuras carreras académicas y/o profesionales, y por no ofrecer oportunidades para demostrar la profundidad o la aplicación del aprendizaje.
Mientras las instituciones académicas trabajan continuamente para mejorar la enseñanza, el aprendizaje y la retroalimentación, la cuestión de si los exámenes son la herramienta mejor y más fiable para evaluar los resultados forma parte de una larga y continua conversación sobre prácticas más amplias de evaluación y retroalimentación.
Este artículo ofrece algunos puntos para reflexionar a la hora de decidir si un examen es un modo de evaluación adecuado para su contexto, basándose en gran medida en una conversación reciente entre la Dra. Mary Richardson, catedrática de Evaluación Educativa de la Facultad de Educación y Sociedad de la UCL, e Ishan Kolhatkar, evangelista global de clientes de Inspera.
¿Por qué los exámenes son una parte tan importante de la evaluación?
A menudo se critica a los exámenes por no ser auténticos ni pertinentes y por evaluar únicamente aspectos superficiales del aprendizaje, como el recuerdo de conocimientos básicos. También se critica el hecho de que se realicen en un tiempo limitado y sin acceso a otros recursos, ya que causan estrés a los estudiantes y, por tanto, les impiden demostrar sus verdaderos logros y potencial.
Sobre este último punto, puede haber preocupaciones particulares en relación con el acceso no equitativo para diferentes géneros y etnias. Si una evaluación tiene que ser una representación auténtica de lo que se espera del estudiante en su futura carrera académica o profesional, probablemente un examen no sea el mejor formato.
Entonces, ¿por qué se utilizan tanto los exámenes?
El profesor Richardson comenta que hay probablemente tres razones fundamentales por las que se puede elegir un examen:
- Eficacia en la aplicación del esfuerzo por parte del alumno. Un examen es un acontecimiento único, y es posible aprender a ser muy bueno en la habilidad de hacer un examen.
- Coste para la institución. La administración de un examen es una forma relativamente barata de gestionar la evaluación. Un grupo de estudiantes realiza el mismo examen al mismo tiempo y, a continuación, se pone a disposición de todos los correctores para que lo corrijan.
- Requisitos específicos de la materia. Es probable que algunas asignaturas requieran siempre un examen. Por ejemplo, los cirujanos, los abogados, los pilotos… estas personas tienen que hacer exámenes de alto nivel de exigencia y presión, ya que es lo que tendrán que hacer en sus carreras, además de tener fácil acceso a los conocimientos. Estos exámenes tienen que ser exigentes y muy estandarizados.
Los exámenes a libro cerrado en condiciones seguras también pueden ofrecer una respuesta sólida a las preocupaciones sobre el uso no autorizado de la IA. Además, algunos estudiantes se resisten a evaluaciones más creativas porque confían en el formato de un examen. Están familiarizados con ellos como herramienta de medición desde una edad muy temprana, y pueden percibirlos como más «justos», ya que a todos se les exigen los mismos requisitos en las mismas condiciones.
¿Cuándo no son apropiados los exámenes como herramienta de evaluación?
Como explica el profesor Richardson, «… la evaluación no debe utilizarse de forma inadecuada para perjudicar al examinando». Un examen estándar que no ha cambiado mucho a lo largo de los años podría estar haciendo exactamente esto al negar al estudiante la oportunidad de aportar pruebas de sus capacidades.
Algunas personas son más capaces de aprender las destrezas necesarias para rendir bien en un examen y, por lo tanto, tendrán ventaja en una situación de examen sobre sus compañeros. Esto significa que el constructo subyacente (conocimientos teóricos o destrezas que se evalúan) de una prueba de examen podría incluir la capacidad para realizar un examen.
Cuando un examen está bien escrito, puede ser adecuado (por ejemplo, para cirujanos o pilotos), pero, de lo contrario, es inadecuado y perjudicial que una persona exija buenas aptitudes para los exámenes con el fin de poder alcanzar los resultados de aprendizaje establecidos en su curso de estudio, que probablemente no incluyan «aptitudes para los exámenes». En realidad, en la mayoría de los casos se deja al estudiante a su aire para que utilice las habilidades que ha ido perfeccionando a lo largo de los años en la escuela, o que ha aprendido específicamente fuera de su campo de estudio, y el riesgo es que a los estudiantes sin habilidades para hacer exámenes no se les ofrece una oportunidad equitativa de demostrar lo que pueden hacer.
Los exámenes perjudican aún más a quienes los realizan, ya que es poco probable que les brinden la oportunidad de crear algo personal para ellos. Ser capaz de crear un artefacto más personal a través de un trabajo de curso tiene el potencial de ser altamente motivador al tiempo que permite al estudiante demostrar sus aprendizajes clave individuales y cómo son capaces de aplicarlos en un contexto del mundo real.
Cómo decidir si los exámenes son la opción adecuada
Aun reconociendo la necesidad de una evaluación más auténtica, inclusiva y significativa, ¿cómo pueden las instituciones tomar la decisión de cuándo utilizar adecuadamente un examen para medir los resultados del aprendizaje?
El profesor Richardson aconseja plantearse una pregunta básica: «¿Qué quiero saber sobre lo que saben mis alumnos cuando hayan terminado mi curso de estudio?». Por ejemplo, ¿necesita saber que «saben», es decir, que tienen acceso a determinados hechos? ¿O que tienen estos conocimientos y pueden evaluarlos de forma crítica? ¿Y/o que pueden explicárselo a otra persona, o aplicarlo en una serie de contextos, o en un contexto específico?
La primera pregunta es aparentemente sencilla y, sin embargo, muy compleja. Obliga al educador a considerar explícitamente cuáles son los resultados en términos de lo que el alumno realmente sabe y puede hacer con esos conocimientos, lo que obliga a crear una evaluación que permita al alumno demostrarlo.
Las evaluaciones deben ser evaluadas para garantizar que no evalúan algo que no es un resultado requerido, y que realmente dan a los estudiantes la oportunidad de demostrar lo que han logrado sin restricciones artificiales y/o innecesarias. Flint y Johnson (2011) investigaron la imparcialidad de la evaluación en una universidad australiana y descubrieron que un factor clave que afectaba a la percepción de los estudiantes de una evaluación justa era la [falta de] oportunidad de demostrar sus capacidades.
Todo esto refuerza la idea de que el educador debe comprender lo que quiere saber sobre lo que saben sus alumnos. Comprender esto es fundamental para el diseño de la evaluación, y la mejor práctica incluiría ayudar a los estudiantes a comprenderlo también.
Al evaluar si la mejor forma de evaluación para su contexto es un examen o no, los educadores deben recordar el poder que tiene la evaluación en cuanto a su impacto en el comportamiento tanto de los estudiantes como de los académicos. Lo que se evalúa es implícitamente lo que se valora, y la forma de cumplir esos requisitos será el centro de una gran cantidad de energía y puede ser un importante motivador.
Cómo mejorar las prácticas de evaluación
Existe un amplio reconocimiento de que las prácticas de evaluación no siempre son adecuadas y, de hecho, a veces son incluso perjudiciales, y parece probable que los exámenes no sean siempre la mejor forma de evaluación a pesar de haberse utilizado durante muchos años. Sin embargo, existe una resistencia a cambiar prácticas bien establecidas, lo que quizá no resulte sorprendente dadas las expectativas que existen de que las evaluaciones desempeñen múltiples funciones.
Una buena evaluación debe ser rigurosa pero no excluyente, debe ser auténtica pero fiable, debe ser exigente pero también justa y equitativa, debe adherirse a normas establecidas desde hace tiempo pero reflejar y adaptarse a las necesidades contemporáneas» (Hounsell, Xu y Tai, 2007, p.1). La constatación de estas múltiples capas de doble función y las contradicciones aparentemente insalvables a menudo obstaculizan la práctica progresista.
La profesora Richardson menciona la necesidad de valentía en el contexto de la enseñanza superior, principalmente reacia al riesgo. Explica que, aunque se ha trabajado mucho en la evaluación del aprendizaje y en un uso más eficaz de las evaluaciones, a veces las políticas pueden bloquear el progreso de los estudiantes.
La profesora Richardson habla del pánico moral que causó en las universidades el Chat GPT, que obligó a muchas instituciones a examinar las prácticas de evaluación en toda la institución para considerar los probables problemas/riesgos del Chat GPT y la mejor manera de mitigarlos. Sin embargo, sostiene que la mayoría de la gente no quiere hacer trampas, algunos sí, pero la mayoría quiere aprender y demostrar su aprendizaje. Como casi todo el mundo en su vida profesional, sabemos que los estudiantes utilizarán grandes modelos lingüísticos que tienen muchas asequibilidades positivas que pueden incorporarse a las evaluaciones.
Por ejemplo, pidiendo a los estudiantes que utilicen grandes modelos lingüísticos para crear un artefacto y que luego lo evalúen e incorporen a su propio trabajo. Permitir esto demuestra buenas prácticas y pedagogía a los estudiantes, ya que la IA es un hecho de la vida académica y profesional, y fomenta la confianza y la responsabilidad.
La profesora Richardson habla de la teoría del empujón y de cómo pequeñas actividades pueden conducir a cambios más amplios, como conversaciones con la gente sobre los cambios que les gustaría ver, cuál es su sueño y qué se puede hacer ahora. La profesora Richardson explica que lo más importante es implicar a los estudiantes en este trabajo y preguntarles qué les resultará más útil cuando se conviertan en profesionales de su campo.
Ishan Kolhatkar describe su práctica anterior como académico, en la que codiseñó un módulo y una evaluación con los alumnos, y en la que proporcionó a una cohorte resultados de aprendizaje y les pidió que aportaran pruebas de que los habían alcanzado. Para que el cambio sea eficaz, es necesario el compromiso de la alta dirección y de los defensores de la iniciativa (Price, 2013). Por lo tanto, es importante saber con quién hay que mantener estas conversaciones y qué tipo de conversaciones son necesarias.
Durante la conversación, Ishan plantea la cuestión de cómo podemos convencer a los reguladores de que las evaluaciones tienen la misma integridad y dificultad cuando hemos proporcionado este nivel de flexibilidad. El profesor Richardson explica que aún queda trabajo por hacer para demostrar la alineación, pero si el curso tiene unos resultados de aprendizaje realmente claros, esta alineación debería ser posible.
¿Tienen cabida los exámenes en una estrategia de evaluación más holística?
Si un examen es una evaluación adecuada, entonces sí tiene cabida. El trabajo de curso o la evaluación continua pueden ofrecer muchas oportunidades para evaluar el aprendizaje, y podría ser que un examen como evaluación del aprendizaje del estudiante en un punto específico de un programa de aprendizaje fuera el formato más apropiado.
Un examen, por tanto, podría reservarse para puntos específicos dentro de una paleta de evaluación más creativa. Por ejemplo, un historiador tendrá acceso a una plétora de recursos cuando organice una exposición en un museo y estudie la mejor manera de implicar al público y fomentar la colaboración con otras instituciones. Sin embargo, cuando se reúna con otra institución para debatir, por ejemplo, cómo compartir recursos o cómo interrelacionar exposiciones, necesitará tener acceso a un conocimiento profundo del tema en cuestión, es decir, de los objetos y de cómo se sitúan en un contexto sociocultural.
Por lo tanto, un menú variado de evaluación podría incluir una evaluación auténtica, como el desarrollo de una exposición y actividades asociadas, así como un examen que exija el acceso a conocimientos sobre historia y artefactos en un tiempo determinado. Aunque el formato de examen puede considerarse inauténtico, sería válido y auténtico en este contexto en la medida en que exige un acceso inmediato a conocimientos específicos.
Es probable que un enfoque más holístico de la evaluación implique más opciones para los estudiantes sobre la forma en que son evaluados, y hay que recordar que un examen también puede ser el formato de evaluación elegido por los estudiantes que son buenos haciendo exámenes y se sienten cómodos con ellos.
También se da el caso de que determinados organismos reguladores exigirán pruebas de que un examen se ha realizado de forma segura y de que existe una confianza absoluta en que la realización es propia del estudiante, sin más apoyo externo que los recursos autorizados, en su caso. Una evaluación más holística o auténtica ofrecerá la posibilidad de recibir apoyo, ya sea de la IA o de otra persona. Podría decirse que un examen administrado en condiciones seguras es la única forma de tener la certeza absoluta de que el rendimiento es el propio esfuerzo del estudiante sin apoyo.
La profesora Richardson está de acuerdo hasta cierto punto con la afirmación de que unas evaluaciones más holísticas significarán que los estudiantes podrán utilizar la IA, pero nos recuerda que históricamente la gente siempre ha tenido miedo al cambio y en épocas de grandes cambios tiende a centrarse en las repercusiones negativas. Cuando nos vemos atrapados en este ciclo, es un buen momento para volver a su pregunta central: «¿Qué quiero saber sobre lo que mis alumnos saben cuando hayan terminado mi curso de estudio?» y pensar si esto puede incluir su uso juicioso de la IA cuando sea apropiado.
¿Deben diseñarse los exámenes al margen de las prácticas de evaluación?
La garantía de calidad en las instituciones seguirá centrándose, sin duda, en los resultados verificables de la evaluación, y exigirá que las evaluaciones utilizadas con fines sumativos sean sólidas y coherentes con la práctica dentro de esa institución y en otras instituciones de enseñanza superior. Esto, a su vez, conduce a centrarse en medidas fácilmente cuantificables de los resultados de los estudiantes y la rendición de cuentas, lo que puede inhibir los cambios en los exámenes más tradicionales. Pero esto no significa que las evaluaciones no puedan tener un diseño más holístico, sino que, como afirma el profesor Richardson, los resultados del aprendizaje deben ser claramente identificables y demostrables.
Dentro de una dieta mixta y variada de evaluaciones que ofrecen amplias oportunidades para que los estudiantes demuestren su dominio de la materia, los exámenes siguen teniendo su lugar cuando es apropiado que los estudiantes demuestren sus conocimientos en un entorno limitado. Sin embargo, cuando los exámenes no son apropiados, el profesor Richardson nos advierte de que se sabe que repercuten en el rendimiento de los estudiantes de determinados orígenes, y que favorecen a las personas que simplemente son mejores en los exámenes y que se han beneficiado de ello desde que comenzaron la educación escolar.
Los exámenes tienen cabida en un marco de evaluación holística, pero hay que velar por que se utilicen adecuadamente y sin perjudicar a los estudiantes.
Fiona Orel, Senior Account Manager UK&I, Senior Fellowship Advanced HE y antigua educadora
Recursos
- Seminario web de Instructure «El examen está muerto, pero ¿lo está realmente?» (12 de noviembre de 2024) Organizado por Sidharth Oberoi, Vicepresidente de Estrategia de Producto Internacional de Instructure, con Ishan Kolhatkar, Evangelista de Clientes Globales de Inspera, en conversación con la Dra. Mary Richardson, Profesora de Evaluación Educativa de la Facultad de Educación y Sociedad de la UCL.
- Carless, D. (2015). Excelencia en la evaluación universitaria. Oxon: Routledge. Vista previa disponible.
- Flint, N. y Johnson, B. (2011). Hacia una evaluación universitaria más justa: Recognizing the Concerns of Students. London: Routledge. Vista previa disponible.
- Hounsell, D., Xu, R. y Tai, C. (2007). Evaluación integradora: Equilibrando la evaluación del y para el aprendizaje. Guide No. 2. Gloucester: The Quality Assurance Agency for Higher Education. Evaluación integradora: Balancing assessment of and assessment for learning – guide no 2 Consultado el 13 de noviembre de 2024.
- Price, M. (2013). Fomentar el cambio institucional: Overview. En S. Merry, M. Price, D. Carless y M. Taras (eds), Reconceptualising Feedback in Higher Education: Developing Dialogue with Students (pp. 145-146). London: Routledge. Vista previa disponible.