Introducción
La autoevaluación es el proceso a través del cual los estudiantes deciden si han alcanzado o no los objetivos de aprendizaje de un curso. También es un elemento esencial para la autorregulación profesional y una herramienta para identificar las debilidades y determinar las fortalezas de los estudiantes [1]. Particularmente en la educación médica, los estudiantes deben desarrollar habilidades de autoevaluación, que les permitan lograr el desarrollo profesional a lo largo de su vida [2]. Además, al autoevaluar su desempeño, los médicos pueden identificar sus fortalezas y limitaciones, y las áreas en las que deben enfocarse en su educación médica continua [1,3].
En la Facultad de Medicina de la Universidad Nacional Autónoma de México, el plan de estudios es por competencias, y se espera que los estudiantes logren un nivel de avance académico en el desarrollo de cada una de ellas. Las competencias que conforman el plan de estudios son: a) pensamiento crítico, juicio clínico, toma de decisiones y gestión de la información; b) aprendizaje autodirigido y permanente; c) comunicación efectiva; d) conocimiento de la práctica médica y uso de las ciencias biomédicas, sociomédicas y clínicas; e) habilidades clínicas en diagnóstico, pronóstico, tratamiento y rehabilitación; f) profesionalismo, aspectos éticos y responsabilidades legales; g) salud de la población y sistema de atención de la salud: promoción de la salud y prevención de enfermedades; y h) crecimiento y desarrollo personal [4].
La autoevaluación puede contribuir al desarrollo de competencias socioemocionales y, en particular, es fundamental para desarrollar la competencia b), el aprendizaje autodirigido y permanente [5,6], que es una habilidad que los maestros asocian sólo con el papel de los estudiantes. Sin embargo, el profesor puede promoverlo desde la práctica reflexiva a través de estrategias de autoevaluación dirigidas y guiadas. Además, la autoevaluación se ha asociado como un elemento fundamental de la autorregulación profesional [7] y la medicina se ha considerado durante mucho tiempo una profesión autorregulada. Es decir, que los médicos que poseen cualidades de autorregulación son individuos que guían sus actividades dirigidas al logro de objetivos con control, administración y adaptación de sus pensamientos, sentimientos y acciones [8].
Por otro lado, la capacidad de autoevaluación recurrente es esencial para desarrollar la competencia profesional de los médicos y contribuye al autocontrol continuo momento a momento; además, el autocontrol confiere, a la capacidad de notar nuestras acciones, la curiosidad de examinar los efectos y la voluntad de usar esas observaciones para mejorar el comportamiento y el pensamiento en el futuro [6]. Si bien es cierto que la autoevaluación ha demostrado ser eficaz en el desarrollo profesional y académico, es ineficaz para identificar áreas de debilidad personal [9].
Para Krupp et al, la utilidad prevista de la autoevaluación es proporcionar un mecanismo introspectivo para obtener información específica sobre una amplia gama de áreas de crecimiento profesional más allá de la enseñanza y la investigación [10]. La reflexión, la autoeficacia y la búsqueda de evaluación autodirigida son habilidades metacognitivas relacionadas con la autoevaluación en el aprendizaje [11]. Además, la capacidad de autoevaluarnos genera la capacidad de encontrar un equilibrio efectivo tanto en la práctica diaria como en el establecimiento de objetivos personales de aprendizaje.
Los desafíos centrales para desarrollar procesos de autoevaluación son las interrelaciones dinámicas y las tensiones subyacentes entre los componentes de la autoevaluación [12]. Aunque no se garantiza que los estudiantes sean precisos en sus percepciones de los factores que influyen en el rendimiento académico, sus percepciones deben ser consideradas [13]. Además, los maestros deben considerar que las herramientas de autoevaluación tienen un impacto, porque los estudiantes aprenden nutriéndose de la retroalimentación inmediata [14,15].
En las ciencias médicas, específicamente en cirugía, la autoevaluación puede ser útil para la reflexión durante las técnicas de entrenamiento; sin embargo, la evaluación experta parece ser esencial para evaluar las habilidades quirúrgicas [16]. Por lo tanto, las estrategias de evaluación combinadas pueden ser toda una forma de recopilar experiencias de enseñanza y aprendizaje. Además, la participación en actividades de autoevaluación aumenta el compromiso, la autoconciencia, la confianza y el pensamiento crítico en estudiantes universitarios en carreras de ciencias de la salud [17-19].
Aunque la autoevaluación es crucial en medicina, pocos educadores han introducido formalmente la autoevaluación en los planes de estudios de medicina en pregrado. Hay pocos estudios tan completos sobre autoevaluación como el reportado por la Universidad de Misuri, Kansas City, en su programa de medicina, que examinó longitudinalmente la autoevaluación de 211 estudiantes durante cuatro años. Sus resultados muestran que la diferencia entre las calificaciones obtenidas a través de la autoevaluación y la evaluación realizada por los profesores disminuyó a medida que pasaron los años de formación médica. Asimismo, los resultados sugieren que la autoevaluación tiene mérito educativo para evaluar el desempeño clínico y sirve como un estímulo para el aprendizaje y el desarrollo profesional [20].
Sin duda, la evaluación de y para el aprendizaje constituye un proceso fundamental en la formación académica de los estudiantes, ya que permite evaluar el nivel de logro de los resultados de aprendizaje y realizar intervenciones educativas adecuadas. Además, el aprendizaje es una propiedad emergente que requiere autogestión y autorregulación del conocimiento. Sin embargo, la autoevaluación es una estrategia infrautilizada en la educación superior debido al estigma de su interpretación subjetiva. Este trabajo muestra que el uso de criterios de evaluación puede ayudar a llevar a cabo procesos de autoevaluación con mayor conciencia.
Sujetos y métodos
Muestreo
El estudio se realizó en la Facultad de Medicina de la Universidad Nacional Autónoma de México. Se realizó un muestreo no probabilístico por conveniencia. Considerando a los estudiantes matriculados en el curso de Fisiología del segundo año de Medicina, existen 54 grupos de Fisiología, de los cuales, para este estudio, se seleccionaron cinco. Como resultado, el estudio incluyó a 137 estudiantes, de los cuales 16 no completaron la autoevaluación y fueron eliminados. Por lo tanto, el número de estudiantes incluidos en el estudio fue 121.
Diseño metodológico
Realizamos un estudio mixto (cuantitativo y cualitativo). Nuestro objetivo principal fue comparar los resultados académicos de los estudiantes en una prueba objetiva con los resultados autoinformados a través de un proceso de autoevaluación basada en criterios. Primero aplicamos un examen objetivo con preguntas de opción múltiple, cuyo propósito principal fue explorar el nivel cognitivo de los estudiantes en los temas de la tercera unidad temática de Fisiología: Endocrinología y sistema digestivo. Al final de la prueba estandarizada, pedimos a los estudiantes que emitieran una autoevaluación basada en los criterios establecidos en la tabla I. Además, en el último criterio de la autoevaluación, pedimos a los estudiantes que aportaran la nota numérica (en una escala de 0-10) que consideraban que debían recibir en la asignatura y que justificaran su respuesta. De la justificación, obtuvimos diversos comentarios, que en total suman 11.677 palabras con frases que seguían un patrón de respuesta. Con estas frases construimos 10 categorías, que se muestran en la tabla II.
1 | Trabajo en clase y/o participación en sesiones |
| |
2 | Participación en actividades |
| |
3 | Lectura constante de los temas |
| |
4 | Comunicación efectiva con mis compañeros |
| |
5 | Resultado en actividades y exámenes de bloque |
| |
6 | ¿Cuál cree que debería ser su calificación para esta unidad temática? Justifique su respuesta |
Categorización | Clasificación |
---|---|
| |
Buena comprensión de los temas | CA |
| |
Resultado exitoso en el examen | CA |
| |
Consistente con las actividades | CA |
| |
Malos resultados en los exámenes | CB |
| |
Me esforcé por comprender los temas | CB |
| |
Me esforcé mucho | CA |
| |
Participación sustancial | CA |
| |
No pude enviar mi tarea | CB |
| |
No me esforcé lo suficiente | CB |
| |
Poca participación | CB |
CA: calificaciones altas; CB: calificaciones bajas.
Construcción de las categorías
Para el análisis cualitativo y la clasificación de las categorías seguimos un proceso de indagación inductiva, que permite comprender el mundo de la experiencia vivida desde la perspectiva de las personas que lo viven. Para ello, seguimos la metodología utilizada por De la Vega [21,22]: en primer lugar, los datos fueron recogidos a través de la plataforma Moodle del curso y exportados en un documento de texto; a continuación, los autores leyeron la respuesta de cada estudiante y clasificaron los resultados de forma independiente y sin conocer los nombres de los estudiantes (proceso ciego) [21, 22]; posteriormente, los autores se reunieron para establecer un consenso sobre la clasificación de las frases de autoevaluación: de acuerdo con el patrón de repetición y las características de las frases, se agruparon en 'calificaciones altas' y 'calificaciones bajas'; y, por último, se diseñaron hipótesis de estudio y se sometieron a pruebas estadísticas para realizar inferencias sobre los resultados (explicación en el apartado 'Resultados').
Estadística
Los resultados se muestran como el promedio de los datos ± desviación estándar. El análisis estadístico descriptivo y las gráficas se realizaron utilizando el software GraphPad Prism (v. 9.4.0; GraphPad Software Inc., San Diego, CA, Estados Unidos). Mediante la prueba de Wilcoxon se compararon las diferencias entre los grupos. Las puntuaciones con un valor p < 0,05 se consideraron estadísticamente significativas. La prueba de Wilcoxon se obtuvo porque comparamos los datos promedio con variables cuantitativas continuas, no paramétricas, de muestras relacionadas.
Resultados
Las puntuaciones promedio entre la prueba objetiva y la autoevaluación fueron significativamente diferentes:
- Nuestro primer punto fue comparar si había alguna diferencia entre las puntuaciones de la prueba objetiva (preguntas de opción múltiple) y las de la autoevaluación. En la prueba objetiva, el promedio de calificaciones fue de 8,716 ± 1,234, con una puntuación máxima de 10 y un valor mínimo de 3,5. En la autoevaluación, el promedio de calificaciones fue de 8,96 ± 0,926, con una puntuación máxima de 10 y una mínima de 5 (Fig. 1). Con estos resultados, encontramos diferencias estadísticamente significativas entre ambas formas de evaluación.
La categorización en calificaciones altas y calificaciones bajas de las respuestas cualitativas mostró una tendencia de la autoevaluación hacia calificaciones altas:
- Se realizó un análisis descriptivo del número de estudiantes por categoría (Fig. 2a) y la calificación promedio para cada categoría (Fig. 2b). Encontramos que cuatro de las 10 categorías concentraron el mayor número de estudiantes que basaron sus respuestas en ellas. Curiosamente, tres de estas categorías se clasifican como 'calificaciones altas'; entre ellas tenemos la categoría 3: 'Consistente con las actividades de clase' (n = 33; promedio = 9,206 ± 0,384); la categoría 6: 'Me esforcé mucho' (n = 36; promedio = 9,617 ± 0,379); y la categoría 7: 'Participación sustancial' (n = 14; promedio = 9,361 ± 0,563). Finalmente, sólo hubo una categoría para la clasificación de 'calificaciones bajas': categoría 10: 'Poca participación' (n = 21; promedio = 8,176 ± 0,701).
Al comparar los promedios de calificaciones de la prueba objetiva y la autoevaluación en las cuatro categorías con mayor número estudiantes, descubrimos diferencias entre la prueba objetiva y la autoevaluación para las clasificadas como calificaciones altas, pero no para la clasificada como calificación baja:
- Finalmente, comparamos si en cada una de las cuatro categorías con mayor número de estudiantes había diferencia entre la prueba objetiva y la autoevaluación (Fig. 3). Encontramos que en las categorías 'Me esforcé mucho', 'Consistente en las actividades' y 'Participación sustancial', clasificadas como calificaciones altas, existe una diferencia significativa ente el promedio de las calificaciones de la prueba objetiva y la autoevaluación. Por otro lado, en la categoría 'Poca participación', clasificada como calificación baja, no encontramos diferencia significativa entre la autoevaluación y la prueba objetiva.
Discusión
Los procesos de evaluación del y para el aprendizaje deben brindar a los estudiantes realimentación sobre el nivel de logro de su aprendizaje. Además, los estudiantes pueden convertirse en aprendices autorregulados y continuar su desarrollo profesional a lo largo de sus carreras al obtener retroalimentación sobre su desempeño [22]. En este sentido, la autoevaluación es un concepto novedoso para los estudiantes que los obliga a reinterpretar sus roles. Debido a la diversidad de principios, valores, motivaciones, intereses y aspiraciones de los estudiantes, esta reinterpretación de su papel puede tener un resultado positivo, estimulando una actitud activa y crítica hacia el trabajo en grupo y la autoevaluación. O, por el contrario, puede dar lugar a una postura caracterizada por el desinterés, la pasividad y la falta de pensamiento crítico [23]. Ward et al reconocen que el clínico competente persigue el aprendizaje permanente mediante el reconocimiento de deficiencias y la formulación de objetivos de aprendizaje apropiados. A pesar del valor teórico aceptado de la autoevaluación, los estudios han demostrado consistentemente que la precisión de la autoevaluación es pobre. Bergee comparó la autoevaluación, la evaluación por pares y la evaluación de expertos, e informó de que la autoevaluación se correlacionaba mal con la evaluación tanto del maestro como de los pares [24], lo que sugiere que la autoevaluación no es confiable.
Por otro lado, Storjohann et al no encontraron diferencias entre las calificaciones obtenidas por autoevaluación y por evaluación por pares, y las calificaciones dadas por el profesor [25]. Asimismo, Calhoun et al realizaron un estudio longitudinal que comparó las puntuaciones de autoevaluación y evaluación por pares de estudiantes de Medicina de segundo año, e informaron de que fueron significativamente más altas que las puntuaciones de los maestros. En contraste, las puntuaciones de esos mismos estudiantes en su último año no fueron significativamente diferentes de las puntuaciones de los maestros [26]. Esto podría indicar, al menos en parte, que la madurez académica alcanzada por los estudiantes afecta a su autoevaluación. Esta idea es apoyada por Kendrick et al, quienes realizaron un estudio en residentes para explorar su desempeño autopercibido (autoevaluación) y encontraron que el 80% de los residentes se calificaron a sí mismos por debajo de la calificación del maestro [7]. Algo que parece crucial en los procesos de autoevaluación es utilizar criterios que permitan dirigir la autoevaluación de los estudiantes. Además, parece que los estudiantes pueden evaluarse a sí mismos con precisión si están capacitados para implementar la autoevaluación [27].
En nuestro estudio, formulamos una guía de preguntas basadas en el desempeño de los estudiantes durante la 'Fisiología del sistema endocrino y digestivo' (Tabla I). Sin embargo, los estudiantes eran libres de expresar cualquier justificación para su autoevaluación; después de recoger las concepciones de los estudiantes, categorizamos sus respuestas, como se muestra en la tabla II. Nuestros resultados indican una diferencia significativa entre los resultados de la autoevaluación y la puntuación obtenida en una prueba estandarizada. Sin embargo, un número significativo de estudiantes expresa que la consistencia en las actividades académicas ('Consistente con las actividades'), el esfuerzo percibido ('Me esforcé mucho') y la participación ('Participación sustancial' y 'Poca participación') son cualidades que están asociadas con su calificación. Además, hay una diferencia significativa entre la autoevaluación y el examen objetivo para las categorías que llamamos 'calificaciones altas'. En esta clasificación, los estudiantes se autoevalúan significativamente más alto que sus calificaciones en el examen objetivo. Es decir, valoran no sólo los conocimientos cognitivos medidos en la prueba objetiva, sino también su rendimiento académico completo, manifestado en su participación, lectura constante de los temas y búsqueda de información para comprender a profundidad la asignatura, entre otras cualidades esenciales de su formación académica.
Por otro lado, los estudiantes que declararon tener poca participación en actividades educativas ('Poca participación') no presentan una diferencia significativa entre su autoevaluación y su calificación en la prueba objetiva. Esto puede deberse a que saben que su rendimiento académico no fue lo suficientemente fuerte como para sobrepasar la calificación obtenida en la prueba estandarizada. Nuestros resultados respaldan la idea de que la autoevaluación dirigida contribuye a resultados de aprendizaje [28]. Además, como informan Sargeant et al, la autoevaluación 'dirigida' puede facilitar la integración de la retroalimentación externa, especialmente la retroalimentación negativa, con las autopercepciones y permitir su uso para mejorar la práctica. Las implicaciones para la educación y la investigación incluyen una mayor comprensión de las formas en que los médicos asimilan la retroalimentación externa y el papel de los educadores como facilitadores de la autoevaluación 'guiada', además del autoaprendizaje para ayudar a los médicos a integrar la retroalimentación [29].
Nayar et al creen que se requieren más estudios para definir predictores de una buena autoevaluación, y esto fortalecerá la tutoría para ayudar a los aprendices a aprender [30]. Además, como los procesos mentales que causan el prejuicio en cómo nos evaluamos a nosotros mismos suceden sin que nos demos cuenta, es difícil que las tácticas que buscan enfrentar directamente la discriminación funcionen. En lugar de eso, podría ser más efectivo organizar las experiencias educativas de los estudiantes de manera que se impida el funcionamiento eficaz de estos prejuicios inconscientes [31]. Con base en nuestros hallazgos, consideramos que debemos concebir la autoevaluación como una prueba de confianza y madurez en nuestros alumnos y que debemos ser conscientes de que hay subjetividad en la evaluación. Sin embargo, la subjetividad en sí misma proporciona riqueza exploratoria en los resultados.
Limitaciones
Una limitación esencial de este estudio fue la falta de exploración de otras variables biopsicosociales que pueden influir en la autoevaluación de los estudiantes universitarios. Nuestros resultados deben interpretarse con reservas, porque la población estudiantil universitaria en la carrera de Medicina presenta constante autocrítica y reflexión sobre su aprendizaje, por lo que estos datos pueden diferir de otras poblaciones universitarias.
Los temas evaluados en el examen objetivo y el tipo de examen utilizado (preguntas de opción múltiple) son una limitación del estudio, ya que necesitan explorar completamente los temas de la asignatura de fisiología y evaluar el conocimiento con varios instrumentos de evaluación.
Una limitación del estudio fue la selección de los temas de estudio de fisiología, así como el nivel cognitivo que se buscó explorar. Aunque el examen objetivo fue diseñado con base en el perfil de referencia y la tabla de especificaciones del programa académico de la carrera de Medicina de la Universidad Nacional Autónoma de México, los resultados pueden cambiar dependiendo de la materia y el programa de estudio. Por lo tanto, pedimos al lector que los interprete con reservas.