Estimada Editora,
En el volumen 24 de la Revista Española de Nutrición Humana y Dietética, se publicaron este año dos importantes estudios que reportaron la existencia de correlaciones negativas estadísticamente significativas entre la masa grasa (MG) y la prueba countermovement jump (CMJ) en 18 atletas de karate1 y 14 competidores de taekwondo2 respectivamente.
Estos datos fueron analizados mediante el test de significancia estadística de la hipótesis nula (NHST, siglas en inglés) "p<0,05", utilizando el coeficiente de correlación de Pearson, que infiere el rechazo de la hipótesis nula (no correlación) y brinda mayor confianza de verosimilitud al investigador a asumir la hipótesis alterna (correlación)3.
Las inferencias estadísticas según las pruebas frecuentistas de estimación utilizan un umbral de significancia de alfa=0,05, que refiere que la hipótesis nula tiene un 5% de probabilidad de ser cierta en valores "p<0,05", es decir, que hay cierta probabilidad de obtener un valor significativo en ausencia de un efecto verdadero por error, y se rechace la hipótesis nula cuando es cierta (falsos positivos; error de tipo I)3.
La consideración del poder estadístico también está condicionada por el tamaño muestral. Los estudios con una muestra pequeña estiman una menor probabilidad de rechazar la hipótesis nula cuando es falsa y generan una mayor prevalencia de obtener hallazgos con falsos positivos. Estas investigaciones con pequeños datos muestrales presentan mayormente valores estadísticamente significativos con efectos inflados, los cuales refieren una mayor incertidumbre de precisión del efecto verdadero que se evidencia en los intervalos de confianza muy amplios4.
Por ejemplo, las dos investigaciones mencionadas anteriormente reportaron valores estadísticamente significativos de correlación entre el rango de +/-0,49 a +/-0,891,2. En ambos estudios es probable que alguna de estas estimaciones superiores a una asociación débil no sea resultado de una relación más consistente sino por la sobrestimación del coeficiente de correlación. En estos casos de resultados estadísticamente significativos, la consideración de que una relación con un coeficiente alto (r=0,80) es tan consistente como una relación moderada (r=0,50) no siempre es correcta, pues los valores de asociaciones en muestras menores de 250 participantes son inestables y favorecen la estimación de falsos positivos y resultados sesgados al replicar los hallazgos5,6.
Debido a las cuestiones de un mayor error aleatorio por el tamaño de los datos muestrales en los resultados de significancia según el enfoque NHST es recomendable la replicación de estas investigaciones para generar una evidencia concluyente con mayor credibilidad en las ciencias de la salud. Esto es posible mediante la inferencia bayesiana, debido a que permite reanalizar los dos hallazgos con pruebas de significancia reportadas por Ojeda-Aravena, Herrera-Valenzuela y García-García1, y Ojeda-Aravena, Azocar-Gallardo, Galle y García-García2 mediante el método del factor de Bayes7, el cual es referido como la probabilidad de los datos bajo una hipótesis en relación con la otra (hipótesis nula vs. hipótesis alterna)6,7. Es decir, que el factor Bayes estima la cuantificación del grado o evidencia en que los datos apoyan tanto la hipótesis nula como la hipótesis alterna para su contraste más allá de la interpretación dicotómica del rechazo o aceptación de la hipótesis nula (NHST)7-9. Cuya interpretación está basada en el esquema de clasificación de valores de Jefreys7-9: "Débil", Moderado", "Fuerte" "Muy fuerte" y "Extrema" (Tabla 1).
>100 | Extrema | Hipótesis alternativa |
---|---|---|
30+100 | Muy fuerte | Hipótesis alternativa |
10+30 | Fuerte | Hipótesis alternativa |
3,1-10 | Moderado | Hipótesis alternativa |
1,1-3 | Débil | Hipótesis alternativa |
1 | 0 | No evidencia |
0,3-0,9 | Débil | Hipótesis nula |
0,29-0,1 | Moderado | Hipótesis nula |
0,09-0,03 | Fuerte | Hipótesis nula |
0,03-0,01 | Muy fuerte | Hipótesis nula |
<0,01 | Extrema | Hipótesis nula |
Fuente: Creación propia según la escala de clasificación de Jeffreys9
Se tuvo como objetivo de la presente carta presentar dos casos de reanálisis bayesiano para el contraste de las hipótesis estadisticas6, a partir de los datos del tamaño de muestra (14 y 18) y los coeficientes de correlación Pearson de MG-CMJ (-0,55 y -0,84) reportado en los estudios de Ojeda-Aravena et al.1 y Ojeda-Aravena et al.2. El factor Bayes refiere dos interpretaciones: FB10 (a favor de la hipótesis alternativa de significancia) y BF01 (a favor de la hipótesis nula), con un intervalo de credibilidad del 95%8,10.
Los resultados obtenidos del factor Bayes evidenciaron: BF10=3,898 y BF01=0,257 e IC95% [-0,784 a -0,088] en la investigación en atletas de karate1, y BF10=188,705 y BF01=0,005 e IC95% [-0,942 a -0,475] en el estudio con participantes de taekwondo2, cuyas estimaciones respaldaron una mayor evidencia favorable a las hipótesis alternas de las dos relaciones estadísticas entre MG-CMJ1,2. Es importante en la práctica clínica estimar el grado de evidencia de los hallazgos mediante la enfoque bayesiano pues permite precisar el nivel de certeza de los resultados de significancia con datos muestrales pequeños que pueden estar sobreestimados ante una mayor probabilidad de error aleatorio y un poder estadístico limitado.
Así también, se reportan los parámetros del factor Bayes máximo (maxBF10=4,339 y maxBF10=205,2) para determinar la estabilidad de los resultados, cuyos valores similares refieren una mayor consistencia en los hallazgos de la inferencia bayesiana8,10.
El factor Bayes es de gran utilidad en otros análisis y reanálisis estadísticos que se basan en las pruebas de significancia estadística (NHST), siendo de gran relevancia su difusión en las ciencias de la salud11-13, cuyo uso también es referido en las investigaciones cuantitativas sistemáticas que usen dichas pruebas estadísticas para una mayor credibilidad en las conclusiones de estudios metaanalíticos.
Por lo tanto, se considera esta carta como un gran aporte metodológico alternativo. El método del factor Bayes es más idóneo para futuros artículos que utilicen muestras pequeñas dado que las pautas de interpretación de los valores de correlación según el enfoque NHST pueden ser controversiales y varían entre diferentes campos y subdisciplinas de las ciencias de la salud14,15, debido al tipo de investigación, las medidas específicas utilizadas y las poblaciones de interés. En conclusión, la inferencia bayesiana es esencial para precisar el grado de fuerza probatoria de las hipótesis estadísticas más allá de estos marcos referidos.