Introducción
Uno de los objetivos del Espacio Europeo de Educación Superior (EEES) es centrar la enseñanza en el aprendizaje del estudiante, en su formación y capacitación continuas. El EEES enfatiza que el estudiante sea activo y se responsabilice de su propio aprendizaje mientras que el docente le guíe en un proceso dinámico, colaborativo y constructivista entre iguales. Los entornos virtuales de aprendizaje han permitido crear espacios seguros, dinámicos y facilitadores del aprendizaje. Según Gros Salvat, los entornos virtuales de aprendizaje deben proporcionar un espacio social en donde alumnos y profesores construyan conocimiento de forma conjunta [1].
Los registros generados en entornos digitales se han empleado desde hace décadas en el mundo empresarial para conocer mejor las necesidades del cliente y tomar decisiones estratégicas [2-4]. El mundo educativo empezó más tarde a utilizar el análisis masivo de datos. Así, las primeras conferencias sobre minería de datos de educación y analítica de aprendizaje y conocimiento se celebraron en Canadá en 2008, y el primer libro sobre minería de datos en e-learning se publicó en 2006 [5]. La analítica de aprendizaje se vislumbraba como un nuevo método para mejorar la docencia, el aprendizaje, la eficiencia de las organizaciones y la toma de decisiones fundadas [6]. El análisis masivo de datos a nivel educativo se plantea en tres niveles: descriptivo, predictivo y prescriptivo [7].
A diferencia de lo que sucede en otros países [8,9], las instituciones educativas españolas apenas explotan esa fuente de información. Recientemente, tres universidades madrileñas han creado, en colaboración con una empresa, un portal de datos abiertos sobre educación superior [10]. Son escasos los docentes que investigan el uso que hacen sus estudiantes del campus virtual (CV), identifican patrones de comportamiento y detectan tempranamente alumnos en riesgo de abandono [5,11-13], a pesar de haberse hallado correlaciones entre el uso del campus virtual y el sentimiento de pertenencia a una comunidad conectada [14], y el rendimiento académico [15-17].
El objetivo del trabajo es analizar si el comportamiento de estudiantes procedentes de distintas asignaturas, cursos, titulaciones, en diferentes espacios del campus virtual y estudiados de forma global revela la existencia de conglomerados de estudiantes y su posible relación con el rendimiento académico.
Materiales y métodos
Se realizó un análisis multivariante sobre siete espacios correspondientes a cuatro asignaturas, impartidas en los cursos 2017/2018 y 2018/2019, con un total de 517 estudiantes, de los cuales el 69,6% eran mujeres. Las asignaturas formaban parte de los grados en Medicina, Fisioterapia y Podología, y se impartían tres en segundo y una en cuarto curso de sus respectivos grados. Se analizaron espacios virtuales creados en la plataforma Moodle, que podían estar dedicados a la parte práctica, a la teórica o a ambas (Tabla I). Se informó tanto el alumnado como el Vicerrectorado de Tecnologías de la Información y aceptaron que los registros almacenados en Moodle se analizaran con fines académicos.
Asignatura | Curso académico | Grado en | Curso de la titulación | N.o de alumnos | |
---|---|---|---|---|---|
Prácticas | OMH | 2017/2018 | Medicina | 2.o de 6 | 79 |
|
|
|
|||
Prácticas | 2018/2019 | 94 | |||
|
|
||||
Teoría | 94 | ||||
| |||||
Teoría y prácticas | AH | 2017/2018 | Fisioterapia | 2.o de 4 | 60 |
|
|
||||
Teoría y prácticas | BM | 2017/2018 | Podología | 70 | |
|
|
||||
Teoría | SL | 2017/2018 | 4.o de 4 | 62 | |
|
|
|
|||
Teoría | 2018/2019 | 58 | |||
| |||||
7 | 4 | 2 | 3 | 2 | 517 |
AH: Anatomía humana; BM: Biomecánica; OMH: Organografía microscópica humana; SL: Salud laboral.
Las variables analizadas fueron el número de visitas realizadas al campus virtual, de accesos a recursos y a URL, y el uso del foro. Para homogeneizar la variabilidad entre asignaturas, se transformó cada variable en cualitativa dividiendo las frecuencias en cuartiles (Q) en cada asignatura. Respecto del rendimiento, se eligieron: notas finales de prácticas y de teoría en primera convocatoria (prácticas 1 y teoría 1), notas finales en ambas convocatorias (actas 1 y actas 2) y notas de las pruebas de evaluación continua en prácticas (minitest), en función de cada espacio. Las categorías de estas variables fueron: suspenso, aprobado, notable y sobresaliente.
Se aplicó un análisis de correspondencias múltiples [18] a las variables de uso del campus virtual, seguido de un análisis de conglomerados ascendente jerárquico aplicado a las puntuaciones factoriales, utilizando el criterio de Ward con la distancia euclídea. Se obtuvieron clústeres al encontrarse una disminución importante de la variabilidad interclúster al formarse una nueva partición. Los clústeres se describen por las características de uso del campus virtual y de las calificaciones con mayor representación respecto del conjunto total y por las calificaciones con promedios diferenciados del promedio general, cuando se rechaza la hipótesis de una distribución azarosa de los estudiantes a los clústeres (aproximaciones de la distribución hipergeométrica y de la media muestral a la distribución normal, respectivamente). Se utilizó el software SPAD 9.1. El nivel de significación se fijó en p < 0,05.
Resultados
El análisis establece cuatro clústeres, que suponen el 49% de la variabilidad total explicada por la variabilidad interconglomerados. La tabla II recoge las características de cada uno. La figura representa los estudiantes en los dos primeros ejes factoriales agrupados en cuatro clústeres, las variables de uso del campus virtual, rendimiento académico y sexo. Nos permite diferenciar los estudiantes según su nivel de actividad y participación y su relación con el rendimiento académico. Esta representación acumula el 27,9% de la variabilidad inicial.
A | B | |||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|
|||||||||||||||||||
Visitas | Recursos | Foros | URL | Calificaciones | ||||||||||||||||
|
|
|
|
|
||||||||||||||||
Clúster | Q1 | Q2 | Q3 | Q4 | Q1 | Q2 | Q3 | Q4 | Q1 | Q2 | Q3 | Q4 | Q1 | Q2 | Q3 | Q4 | Prácticas 1 | Teoría 1 | Actas 1 | Minitest |
1 (n = 152; 20,9%) | 91%a | ns | ns | ns | 82%a | ns | ns | ns | 57%a | 24%a | ns | ns | 56%a | ns | ns | ns | 6,2 ± 2,4a | 4,4 ± 0,5a | 5,2 ± 2,8a | 6,2 ± 2,4a |
2 (n = 108; 29,4%) | ns | 75%a | ns | ns | ns | 61%a | ns | ns | 53%a | ns | ns | ns | 45%a | ns | ns | ns | ns | ns | ns | ns |
3 (n = 142; 27,5%) | ns | ns | 79%a | ns | ns | ns | 54%a | ns | ns | ns | ns | 51%a | ns | 26%c | 37%a | ns | 7,6 ± 1,4b | 6,2 ±2 ,3c | 7,1 ± 2,3b | ns |
4 (n = 115; 22,2%) | ns | ns | ns | 88%a | ns | ns | ns | 76%a | ns | ns | ns | 48%b | ns | ns | ns | 63%a | ns | ns | 7 ± 2c | 7,7 ± 1,3b |
Total (n = 517; 100%) | 25% | 25% | 26% | 24% | 24% | 26% | 26% | 24% | 42% | 11% | 20% | 37% | 33% | 20% | 21% | 26% | 7,1 ± 2 | 5,7 ± 2,4 | 6,5 ± 2,5 | 7,1 ± 1,7 |
ns: no significativo.
ap < 0,001;
bp < 0,01;
cp < 0,05.
El clúster 1 tiene mayor proporción de estudiantes del Q1 en número de visitas y accesos a recursos y a URL y del Q1 y el Q2 de accesos a foros. Agrupa el 70% de los estudiantes menos activos en accesos a recursos y el 75% de los que menos visitas realizaron de todos los estudiantes. Contiene mayor proporción de suspensos en teoría 1, suspensos y aprobados en actas 1, aprobados en prácticas 1, y suspensos y notables en actas 2, así como de varones (38,9 frente a 30,4%).
El clúster 2 tiene una mayor representatividad de estudiantes con visitas y accesos a recursos en el Q2, así como de accesos a URL y a foros en el Q1. Aglutina el 70% de los estudiantes con accesos a recursos y el 88% de visitas del Q2 del total de estudiantes. No hay diferencias estadísticamente significativas en el rendimiento académico, salvo una mayor proporción de notables en prácticas 1.
El clúster 3 agrupa al 84% de los estudiantes con número de visitas en el Q3, representado por estudiantes del Q3 en acceso a recursos, del Q2 y el Q3 en acceso a URL y del Q4 en acceso a foros. Presenta mayor proporción de sobresalientes en actas 1 y de mujeres (79,6 frente a 69,6%).
El clúster 4 incluye mayoritariamente a los más activos (Q4) en número de visitas y accesos a recursos, URL y foros. Del total de estudiantes, aglutina el 82% de los de mayor número de visitas y el 71% con mayor número de accesos a recursos. Tiene mayor proporción de sobresalientes en prácticas 1 y minitest.
Al analizar el rendimiento medio de los estudiantes de los clústeres, encontramos que las variables características de los clústeres 1, 3 y 4 reflejan claras diferencias del promedio general. Así, los individuos de los clústeres con mayor uso del campus virtual alcanzan mejores notas (medio punto en promedio) en teoría 1, prácticas 1, actas 1 y minitest que el promedio de todos los estudiantes, en tanto que los estudiantes más pasivos obtuvieron peores notas medias en teoría 1, prácticas 1, actas 1 y minitest (un punto menos en promedio).
Discusión
De acuerdo con Buckingham Shum y Ferguson, el enfoque del análisis de datos puede hacerse en tres niveles [19]: a) micro, esto es, en un curso o asignatura; b) meso, es decir, en una titulación, y c) macro, si se refiere a un centro de estudios. Este estudio se sitúa entre los niveles micro y meso al analizar varios espacios virtualizados de distintos grados de Ciencias de la Salud.
Un entorno virtual de aprendizaje requiere que el espacio virtual sea también un espacio social [20] en el que los usuarios tengan una mayor libertad de elección, puedan escoger distintos trayectos y ritmos, y decidir las interacciones que realizan. En la bibliografía se discute la relevancia de los datos de las plataformas digitales educativas. Algunos autores argumentan que una parte significativa de las interacciones entre estudiantes acontecen en las redes sociales [21] y otros dudan de que el mero análisis de los datos cuantitativos permita interpretar el comportamiento de los estudiantes si no se conoce el contexto [22]. Por ello, algunos trabajos proponen clasificar las interacciones [21,23,24], seleccionar los registros [25,26] y vincular las acciones de los estudiantes con condiciones internas y externas [17].
Sin embargo, numerosas evidencias indican una relación clara entre entorno virtual de aprendizaje y rendimiento académico en distintas áreas de conocimiento. Aunque se han descrito usos erráticos y dispares [27,28], y algunos autores consideran que puede ser un factor de distracción [29], muchos trabajos han demostrado un efecto positivo del campus virtual en las calificaciones [30-33] y que la actividad registrada puede proporcionar una medida indirecta válida del compromiso y la motivación del alumnado [34].
Conclusiones
Este trabajo realiza un análisis retrospectivo global de una muestra de estudiantes de asignaturas muy diferentes en cuanto a duración, número de créditos y peso relativo de teoría y prácticas, curso académico de la titulación, diseño del campus virtual, herramientas docentes empleadas y sistema de evaluación. Esta aparente diversidad no ha impedido encontrar un denominador común en el alumnado: el uso del campus virtual se relaciona directamente con los resultados académicos, de forma que, a menor interacción, peores calificaciones de todas las variables en primera convocatoria, mientras que, a mayor actividad registrada, mejores calificaciones en todas ellas. Así pues, nuestros resultados demuestran, también al analizar globalmente muestras de estudiantes universitarios procedentes de varias asignaturas, titulaciones y cursos, la existencia de una relación directa entre el uso de Moodle por el alumnado y el rendimiento académico.
La identificación de patrones de aprendizaje a partir de los registros generados en entornos virtuales de aprendizaje proporciona información valiosa para la mejora de la docencia, ya que permite a los profesores realizar un seguimiento y adoptar estrategias adaptativas, y también para los estudiantes, que pueden requerir asesoramiento para mejorar sus calificaciones y redefinir sus metas [35]. A nuestro juicio, los retos principales que debe enfrentar la analítica de aprendizaje son fomentar el aprendizaje personalizado, incluir en el análisis de variables externas al propio uso de entornos virtuales de aprendizaje, como pueden ser datos socioeconómicos del alumnado, y mejorar la retroalimentación que recibe cada estudiante.