INTRODUCCIÓN
Por lo general, la población considera que las intervenciones a través de la actividad física y el deporte tienen exclusivamente como objetivo la mejora la condición física y la creación de hábitos de vida saludables (Martínez, Mármol, Velenzuela, Sánchez, y Luís, 2012). Sin embargo, el deporte y la actividad física correctamente planificados, con una metodología específica, puede contribuir a la prevención de conductas antisociales y a la mejora de la calidad de vida y del bienestar personal y social (Jiménez & Durán, 2005). Por ello en las instituciones educativas se realizan evaluaciones periódicas para el control de la calidad en los programas académicos.
La búsqueda constante de la calidad del sistema escolar ya no se supone a partir de las estadísticas de reprobación y deserción; si no que se debe de tomar en cuenta distintas herramientas de medición. Arraya-Castillo (2013) argumenta que la calidad del servicio es vista por universidades y/o instituciones académicas como componente de la estrategia para satisfacer las necesidades de sus clientes, “los estudiantes” aunque estos no son los únicos clientes. Existen los clientes internos (recursos humanos dentro de las instituciones) y externos (estudiantes y padres de familia) de dichas instituciones académicas. (Morales-Sánchez, Hernández-Mendo y Blanco, 2009)
Es por ello la búsqueda de mecanismos para la evaluación de la calidad en las instituciones académicas cada vez son más requeridas, que sean innovadores y con una alta fiabilidad y validez, fáciles de aplicar por los gestores académicos.
En México, Existen algunas instituciones encargadas de realizar dichas evaluaciones periódicas como lo son COOPEMS, CENEVAL, ISO entre otras, pero la idiosincrasia propia del sistema educativo, requiere de más instrumentos que analicen áreas temáticas diferentes y que sean sobre todo fáciles de aplicar y comprender por los gestores académicos, así esto permitirá conocer la realidad y establecer un programa de intervención que permita mejorar la calidad y el éxito de la de los programas educativos deseados.
La educación es el vehículo por medio del cual los individuos de una sociedad no sólo se aproximan al conocimiento, sino que acceden a nuevas formas y dimensiones de su vida, que contribuyen a mejorar la calidad de la misma (Horbath, 2014). En el caso de la educación física, cultura física, y el deporte, en México, desde hace pocos años se han ido adaptando mecanismos de evaluación de la calidad, principalmente al sector privado y a las instituciones recreativas o deportivas.
La importancia social de esta evaluación de la calidad en la asignatura de la Cultura física y Salud (nombre con la que se designa la asignatura en las instituciones educativas) viene determinada por los trabajos publicados en los últimos años, que han analizado las relaciones entre la práctica de actividad física, el desarrollo de la condición física y el funcionamiento cognitivo (Donnelly et al., 2016). Los hallazgos encontrados en numerosas investigaciones han contribuido a consolidar este fenómeno como uno de los más interesantes en el ámbito de la actividad física y la salud. Su evidencia se ha identificado tanto tras la realización de una sesión de ejercicio físico después de un programa estructurado en el tiempo, siendo el ejercicio aeróbico el que ha demostrado mayor efectividad (Chaddock, Hillman, Pontifex, Jonhson, Raine y Kramer, 2011); Kempermann et al., (2010); O'Leary, Pontifex, Scudder, Brown y Hillman, 2011). Esto tiene un alto impacto positivo para el buen funcionamiento cognitivo en el desarrollo personal y social (Santana et al. 2017; Zmyj, Witt, Weitkämper, Neumann, y Lücke, 2017) y contribuyen a la mejora física, mental y social de los jóvenes, a edades tempranas (Becerra, Reigal, Hernández-Mendo, A. y Martín-Tamayo, 2013, Biddle, Sallis y Cavill, 1998; Cantera, y Devís, 2002; Sallis y Patrick,1994; Reloba-Martínez, Reigal-Garrido, Hernández-Mendo, Martínez-López, Martín-Tamayo y Chirosa-Ríos, 2017; Reigal-Garrido, Becerra-Fernández, Hernández-Mendo y MartínTamayo, 2014) y a la socialización (Asenjo y Maiztegui, 2000; Bracht, 1996; Puig, 1996; Hernández-Mendo y Planchuelo, 2012; Hernández-Mendo y Planchuelo, 2014).
Para evaluar la calidad del servicio, uno de los instrumentos más utilizados es el SERVQUAL, fue desarrollado por Parasuraman, Zeithlm y Berry (1985). Es un instrumento que les permitió aproximarse a la medición de la calidad mediante la evaluación por separado de las expectativas y percepciones de los clientes. El cuestionario SERVQUAL ha sido utilizado por diversos estudios en el área de la educación, de la educación física y deporte (Morales-Sánchez, Berrocal, Morquecho y Hernández- Mendo, 2013; Morales-Sánchez, Hernández-Mendo y Blanco, 2009; Morales-Sánchez, Pérez-López, Morquecho-Sánchez y Hernández-Mendo, 2016; Pérez-López, Morales-Sánchez, Anguera y Hernández-Mendo, 2015). Además de su utilización para evaluar la calidad del servicio en el ámbito de la educación primaria, secundaria y en la universidad (Morquecho-Sánchez, Medina-Rodríguez, Ceballos-Gurrola y Morales-Sánchez, 2016), otras investigaciones han demostrado su consistencia (Bigné, 1995; Dubé, 1994; Fick y Ritchie, 1991; Hernández-Mendo, 2012; Kendall, 1989; Le Blanc, 1992; Llorens, 1994; Morales 2003; Morales-Sánchez, Hernández-Mendo y Blanco, 2005; Morales-Sánchez, Hernández-Mendo y Blanco, 2009).
En este trabajo se realiza una adaptación cultural del cuestionario SERVQUAL al contexto estudiantil de bachillerato en México. El objetivo específico de este estudio, es comprobar si la estructura factorial y la fiabilidad de esta herramienta corrobora los resultados encontrados por Parasuraman, Zeithaml y Berry (1993). Para lo cual se ha utilizado el Análisis Factorial Mixto y Confirmatorio (AFC).
MATERIAL Y MÉTODOS
Participantes
Se realizó un muestreo de carácter intencional, y por conglomerados. Los participantes son estudiantes del bachillerato de la Universidad Autónoma de Nuevo León, México, UANL, y participan ocho instituciones académicas distribuidas en el área metropolitana del estado de Nuevo León en los municipios de Escobedo, San Nicolás, Santa Catarina, Monterrey, Apodaca y Guadalupe.
En el muestreo se recogieron datos de un total de 1501 estudiantes, con un rango de edad entre 15 y 18 años, la distribución por género fue de 853 mujeres (que supone el 59% de la muestra) y 648 hombres (41%). El rango de edad oscila entre los 15 y los 18 años.
Instrumentos
El SERVQUAL es una escala de medición de la calidad del servicio, formada a partir de dos escalas, la primera de expectativas con 22 items, y la segunda de percepciones con otros 22 items; que hacen referencia a cinco dimensiones de la calidad del servicio. Existen otras cinco cuestiones adicionales que permiten que el encuestado valore la importancia relativa de cada una de las dimensiones de la calidad del servicio, repartiendo un total de 100 puntos entre las diferentes dimensiones.
El cuestionario utilizado está estructurado en cuatro secciones: (1) En la primera sección se cuestionan las expectativas que tiene el cliente o estudiante, respecto a la asignatura de cultura física y salud. (2) La segunda sección muestra la cuantificación de las evaluaciones de los estudiantes respecto a la importancia relativa de las cinco dimensiones o criterios sobre la calidad del servicio (elementos tangibles, fiabilidad, capacidad de respuesta, seguridad y empatía). Se cuestionaba los datos sociodemográficos de los estudiantes así como 5 preguntas referentes a la cultura física o deporte que puedan realizar extra a la que se le imparte en la escuela. (3) La tercera sección mide las percepciones de los estudiantes respecto a la calidad del servicio, es decir la manera en que ellos reciben dicho servicio en las instituciones académicas donde residan. (4) La cuarta sección adicional, sobre preguntas abiertas con respecto a la asignatura: ¿Qué sugerencia le haría a la asignatura de cultura física y salud para mejorar?
Los ítems, tanto en las expectativas como en la de las percepciones, se han agrupado, en función de cinco dimensiones originales y confirmadas en otra investigación (Morales-Sánchez, Hernández-Mendo y Blanco, 2009): (1) Elementos tangibles: Apariencia de las instalaciones físicas, equipos, personal y materiales de comunicación. Declaraciones 1 a 4, con una fiabilidad en la escala de expectativas de 0.82 y la escala de percepciones de 0.85. (2) Fiabilidad: Habilidad para ejecutar el servicio prometido de forma fiable y cuidadosa. Declaraciones 5 a 9. Con una fiabilidad en la escala de expectativas de 0.90 y la escala de percepciones de 0.89. (3) Capacidad de respuesta: Disposición y voluntad para ayudar al cliente y proporcionar un servicio rápido. Declaraciones 10 a 13, Con una fiabilidad en la escala de expectativas de 0.88 y la escala de percepciones de 0.89. (4) Seguridad: Conocimientos y atención mostrados por los empleados y sus habilidades para inspirar credibilidad y confianza. Declaraciones 14 a 17, con una fiabilidad en la escala de expectativas de 0.90 y la escala de percepciones de 0.92. (5) Empatía: Atención individualizada que ofrecen las organizaciones a sus consumidores. Declaraciones 18 a 22, con una fiabilidad en la escala de expectativas de 0.90 y la escala de percepciones de 0.90.
Procedimiento
Se realizó la adaptación del cuestionario al contexto mexicano estudiantil siguiendo el trabajo de Morales-Sánchez, Berrocal, Morquecho y Hernández-Mendo (2013). En el cual adaptaron dicho cuestionario al contexto estudiantil de nivel secundaria y bachillerato, en España.
Para esta ocasión se creó una comisión de 6 expertos del área de cultura física y de gestión de la calidad, y se analizaron los posibles cambios a los cuestionarios, posteriormente se realizaron las adaptaciones al instrumento conforme a la retroalimentación recibida.
Se calendarizo las visitas a las instituciones académicas para la entrevista con los directores y coordinadores de las mismas, se les proporciono la información del proyecto y la autorización del director en jefe de todas las instituciones académicas de la UANL; así mismo se les entrego los oficios correspondientes a los permisos para entrar aplicar el cuestionario.
Se siguieron las recomendaciones de la declaración de Helsinki, (revisión 2013) de buena práctica clínica de la CEE. Documento 111/3976/88 de julio de 1990 en la normativa legal española que regula la investigación clínica en humanos (real decreto 561/1993 sobre ensayos clínicos). Se proporcionó la aceptación de los directores y se procedió a realizar nuevamente la calendarización de visitas para la aplicación del cuestionario. Con el previo consentimiento informado (aceptación) de parte de los estudiantes, se aplicó el cuestionario a 150 alumnos aproximadamente por institución, los estudiantes eran elegidos de forma aleatoria los salones de clase, ya que varía el número de población por cada institución. Y finalmente se procedía a la aplicación del cuestionario.
Los criterios de inclusión fueron:
Alumnos activos en la asignatura de cultura física y salud que tuvieran anteriormente la asignatura como mínimo 1 semestre (6 meses de antigüedad) y que fueran alumnos regulares en cada institución académica.
Programas estadísticos
Se utilizó el programa SPSS V.21, para realizar los análisis descriptivos, el programa FACTOR de Lorenzo-Seva (2006), para el análisis factorial mixto y el programa PRELIS 2.30 y LISREL 8.30 de Jöreskog y Sörbom, (1999). Para realizar el análisis factorial confirmatorio.
Análisis estadístico
Se realizaron pruebas de fiabilidad y de AFM (Lloret-Segura, Ferreres-Traver & Tomás-Marco, 2014), se estimó el coeficiente Kaiser-Meyer-Olkin (KMO) y la prueba de esfericidad de Bartlett, así como un análisis de matriz de correlaciones con el objetivo de determinar la pertinencia de dichos análisis (Visauta, 1998). Finalmente se realizó un análisis factorial confirmatorio y se estimaron indicadores de error, de bondad de ajuste, fiabilidad compuesta, varianza media extractada, validez convergente y validez discriminante
RESULTADOS
Una de las condiciones de aplicación del análisis factorial mixto es que la matriz de correlaciones entre los ítems no sea esférica. En este caso la matriz de correlaciones resultó adecuada para la factorización. Para comprobar este supuesto se procedió a realizar la prueba de esfericidad de Bartlett y la obtención del índice KMO, cuyos resultados indicaron que la muestra era adecuada para la realización del análisis factorial exploratorio.
Los resultados de ambas pruebas mostraron, por un lado que la matriz de correlaciones entre los ítems obtuvo un alto valor (Chi cuadrado (231)= 7668.9; p<.001). La medida de adecuación muestral del índice KMO fue de .90. Con estos resultados se puede afirmar que la matriz de datos era adecuada para la aplicación del AFM, a través del programa estadístico FACTOR (Lorenzo-Seva, 2006)
El resultado de ambas pruebas mostro, que la matriz de correlaciones entre los ítems obtuvo un alto valor (Chi cuadrado (231)= 16137.1; p<.001). La medida de adecuación muestral del índice KMO fue de .94 con estos resultados se puede afirmar que la matriz de datos era adecuada.
Se pudo observar los autovalores de cada factor, y los porcentajes de varianza explicada asociados de la escala de expectativas que ascienden a un 55%, con lo se considera que es significativo.
En la Tabla 2, se puede observar los autovalores de cada factor, y los porcentajes de varianza explicada asociados de la escala de percepciones que ascienden a un 71%, con lo cuales consideramos que también es significativo.
Los cuestionarios utilizados, son sometidos a un análisis factorial confirmatorio. Se describen los datos relativos a pesos factoriales, fiabilidad e índices de ajuste (GFI, AGFI y CFI) y de error (RMSR y RMSEA) para cada una de las escalas que componen los distintos cuestionarios. Acerca de estos últimos y a modo de breve recordatorio, consideraremos que:
GFI (Goodness of Fit Index): Índice de Bondad de Ajuste, oscila entre 0 (mal ajuste) y 1.0 (ajuste perfecto). Representa el grado de ajuste conjunto aunque no está ajustada por los grados de libertad. Altos valores indican un mejor ajuste (>0.9), aunque no existe ningún umbral absoluto de aceptabilidad (Jöreskog y Sörbom, 1993).
AGFI (Adjusted Goodness of Fit Index): Índice Ajustado de Bondad. Este índice es una extensión de GFI. Se ajusta utilizando la ratio obtenida entre los grados de libertad del modelo propuesto y los grados de libertad del modelo nulo. Un nivel aceptable y recomendado es un valor mayor o igual a 0.90. Se considera índice de ajuste y parsimonia, penaliza los modelos con muchos parámetros. La discrepancia entre GFI y AGFI indican la inclusión de parámetros insignificantes, no se ven afectados por el tamaño muestral.
CFI (Comparative Fit Index): Índice de Ajuste Comparado. Este índice junto con otro suministrado por este análisis tales como, IFI (Incremental Fit Index), RFI (Relative Fit Index) representa una comparación entre el modelo estimado y el modelo nulo o independiente. Los valores oscilan entre 0 y 1.0. Valores altos indican una alta calidad de ajuste (Bentler, 1990).
NNFI (Non-Normed Fit Index o Índice de Ajuste No Normado). Este índice fue propuesto por Tucker y Lewis (1973), no introduce directamente el estadístico χ2 sino que lo compara previamente con su esperanza, los grados de libertad del modelo base (gb) y del modelo en cuestión (g). Si el modelo es correcto, la esperanza es aproximadamente igual a la unidad para cualquier tamaño muestral. La cuota superior no es la unidad y valores superiores a 1 tienden a indicar sobreparametrización del modelo.
RMR (Root Mean Residual o Residuo Cuadrático Medio). RMSR (Root Mean Square Residual o Raíz Cuadrada Residuo Cuadrático Medio). Este índice se obtiene a través de la raíz cuadrada de los residuos al cuadrado, entre las matrices observadas y estimadas. Se utiliza normalmente con matrices de correlaciones ya que éstas no dependen de la unidad de medida como es el de las covarianzas. Al no tener en cuenta, los grados de libertad, no se ha fijado un umbral para su interpretación. Se puede realizar una interpretación en función de los objetivos de la investigación. Se pueden considerar como aceptables, con valores comprendidos entre 0.05 y 0.08.
RMSEA (Root Mean Squared Error of Aproximation): Error de Aproximación Cuadrático Medio. Es un índice que da cuenta de la discrepancia en grados de libertad pero medido en términos de población. El valor es representativo de la bondad de ajuste que podría esperarse si el modelo fuera estimado con la población. Los valores que pueden considerarse aceptables oscilan entre 0.05 y 0.08. Proporciona intervalos de confianza y la posibilidad de poner aprueba hipótesis en el análisis de los residuales.
Por lo que respecta a los índices de bondad de ajuste de la escala de expectativas, se sitúan por encima 0.90 (1 para el Índice Comparativo de Ajuste CFI; 0.99 para el Índice de Bondad de Ajuste AGFI y 1 para el Índice de Bondad GFI). Los índices de error se sitúan por debajo 0.10 (RMSEA=0.025, RMR=0.05, RMR estandarizado =0.05). Reflejados en la tabla 3.
Los índices de bondad de ajuste de la escala de percepciones, se sitúan por encima 0.90 (1 para el Índice Comparativo de Ajuste CFI; 1 para el Índice de Bondad de Ajuste AGFI y 1 para el Índice de Bondad GFI). Los índices de error se sitúan por debajo 0.10 (RMSEA=0.0, RMR=0.025, RMR estandarizado=0.025). Reflejados en la tabla 3.

Tabla 3. Comparativa de indicadores de ajuste y error del análisis factorial confirmatorio de la Escala 1 Expectativas y 2 Percepciones de a adaptación del cuestionario SERVQUAL.
Se comprobó la fiabilidad de cada uno de los factores del cuestionario, determinándose el coeficiente del alfa de Cronbach. Comprobándose que el valor obtenido bajo el rango establecido por George y Mallery (2003) y Nunnally (1976) para aceptar la consistencia interna, se puede afirmar que el resultado obtenido es fiable para este cuestionario. (Mostrado en la tabla 4).
La Varianza Media Extractada (AVE Average Variance Extracted) mide el porcentaje de varianza capturada por un constructo mostrando la ratio de la suma de la varianza capturada por el constructo y la varianza de medida. Es una medida complementaria de la fiabilidad compuesta. Cuando es superior a 0.50 implica que un alto porcentaje de la varianza es explicada por el constructo en comparación con la varianza del error de medida (Arias, 2008).
La Fiabilidad Compuesta (Composite Reliability) corresponde a la fiabilidad conjunta de los indicadores de una variable latente (Arias, 2008).
La Fiabilidad compuesta de la tabla 5 muestra en todos sus valores que el promedio de las cargas estandarizadas sobre los ítems son superiores de 0.7 (Hair, Anderson, Tatham y Black, 1998) indicando una alta fiabilidad. En relación a la Varianza Media extractada, es una medida complementaria de la fiabilidad compuesta. Caundo ρ>0.50 implica que un alto porcentaje de varianza es explicada por el constructo en comparación con la varianza del error de medida.
Los resultados de la fiabilidad compuesta de ambas escalas son satisfactorias por encima del (>.70), respecto a la varianza media extractada.
La validez convergente (convergent validity), coeficiente de correlación entre medidas del mismo constructo cuando se utilizan distintos procedimientos de medida. Los valores de t se utilizan para contrastar la hipótesis de que el parámetro es distinto de 0 (H0 -Hipótesis Nula) en la población y aceptamos la H1 (Hipótesis Alternativa) sit≥|1.96|. Los valores t superiores |1.96| proporciona evidencia de la validez de los indicadores utilizados para medir los constructos de interés. Si todas las saturaciones de los indicadores que evalúan el mismo constructo fueran estadísticamente significativas (t≥|1.96|), los valores significativos de t indican que todos los indicadores evalúan el mismo costructo (Arias, 2008).
Los resultados de la validez convergente (Tabla 6 y 7) muestra en todos los ítems valores t superiores a |1.96|, proporcionando así, evidencia de la validez para medir los constructos.
DISCUSIÓN
Este cuestionario pretende evaluar las expectativas y las percepciones de los clientes externos (estudiantes), en este caso, de una asignatura que se imparte en el bachillerato en Nuevo León, México. La calidad dentro de las instituciones académicas en los últimos años ha sido de vital importancia para los clientes internos (recursos humanos dentro de las instituciones) y externos (estudiantes y padres de familia) de dichas instituciones. Una de las cuestiones más importantes dentro de las organizaciones es la fidelización de los clientes y de sus propios recursos humanos (clientes internos). El objetivo es la obtención optima de satisfacción, un buen ambiente laboral y un adecuado clima organizacional que ayuden en la obtención de un servicio de calidad total (Morales-Sánchez, Hernández-Mendo y Blanco, 2009; Morales-Sánchez, Berrocal, Morquecho y Hernández-Mendo, 2013; Zardoya, Alegría et al. 2004) y en otros servicios deportivos como (Martínez-Tur, 1998); Mañas Rodríguez et al., 2008).
Siguiendo los trabajos de Morales-Sánchez, Berrocal, Morquecho y Hernández-Mendo (2013) y Morales-Sánchez, Hernández-Mendo y Blanco (2009), los índices de ajuste estimados mediante AFM y AFC son adecuados y permiten postular que su estructura factorial se confirma, y las restricciones especificadas en el modelo son satisfactorias. Los resultados obtenidos, permiten afirmar que el cuestionario SERVQUAL posee propiedades psicométricas satisfactorias, tanto de fiabilidad como de consistencia interna (Morales-Sánchez, Hernández-Mendo y Blanco, 2009). En relación a los resultados de la estructura factorial del modelo referentes a los índices de error RMSEA y los índices de ajuste CFI y NNFI presentan un ajuste adecuado; en lo que respecta a la razón de chi cuadrado/ grados de libertad (gl) resulta satisfactoria, utilizando el método de máxima verosimilitud (ML). Así mismo los resultados de la fiabilidad compuesta de ambas escalas son satisfactorias.
El cuestionario SERVQUAL se puede considerar como una herramienta para la evaluación de calidad de los servicios educativos, los índices de ajuste y error de las dos escalas expectativas y percepciones, se encuentran en los valores recomendados para aceptar el modelo.
Se puede considerar que la aplicabilidad de este cuestionario al contexto de la población juvenil de estudiantes de bachillerato y/o en la educación media superior mexicana es adecuado. El modelo SERVQUAL ha mostrado que atiende a las necesidades de la comunidad estudiantil para realizar análisis de calidad del servicio académico que reciben los estudiantes.
Como futuras líneas de investigación se propone aplicar dicho cuestionario a los clientes internos de las instituciones académicas para así evaluar la calidad total del contexto estudiantil de nivel medio superior en México.
APLICACIONES PRÁCTICAS
El instrumento SERVQUAL utilizado en este proyecto, es válido y fiable para evaluar la calidad de la asignatura de cultura física y salud. Con este instrumento se pueden apoyar para mejorar los programas académicos, encontrar factores de riesgo, entre otras situaciones.
En el caso de la actividad física y la salud, la educación física y recreación, en México no existen pruebas de la utilización de este tipo de cuestionarios para mejorar la calidad de los programas académicos, en las universidades públicas y privadas del país.