SciELO - Scientific Electronic Library Online

 
vol.40 número1Polimorfismo rs266729 del gen ADIPOQ. ¿Qué rol juega la ancestralidad genética en la distribución de sus alelos? índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • En proceso de indezaciónCitado por Google
  • No hay articulos similaresSimilares en SciELO
  • En proceso de indezaciónSimilares en Google

Compartir


Nutrición Hospitalaria

versión On-line ISSN 1699-5198versión impresa ISSN 0212-1611

Nutr. Hosp. vol.40 no.1 Madrid ene./feb. 2023  Epub 17-Abr-2023

https://dx.doi.org/10.20960/nh.04519 

CARTAS AL DIRECTOR

¿Cómo determinar efectivamente si una serie de datos sigue una distribución normal cuando el tamaño muestral es pequeño?

Ángel Roco-Videla1  , Rodrigo Landabur-Ayala2  , Nelson Maureira-Carsalade3  , Mariela Olguin-Barraza4 

1Facultad de Salud y Ciencias Sociales. Universidad de las Américas. Santiago, Chile

2Departamento de Psicología. Universidad de Atacama. Atacama, Chile

3Departamento de Ingeniería Civil. Facultad de Ingeniería. Universidad Católica de la Santísima Concepción. Concepción, Chile

4Programa de Magister en Ciencias Químico-Biológicas. Facultad de Ciencias de Salud. Universidad Bernardo O’Higgins. Santiago, Chile

Sr. Editor:

En la metodología de la publicación de Tomás y colaboradores (1) se declara haber trabajado con 12 sujetos utilizando la prueba de Kolmogorov-Smirnov (KS) para determinar si los datos seguían o no una distribución normal. Queremos hacer algunas observaciones respecto al uso de pruebas para evaluar la distribución de datos y la sensibilidad que presentan al tamaño muestral. Cuando contamos con menos de 50 unidades, no se recomienda utilizar la prueba de KS porque presenta un bajo poder para detectar la no normalidad de los datos (2). Saculinggan y colaboradores (2) analizaron el poder de detección de la no normalidad en muestras con n = 10, hasta n = 60, donde las de tamaño 10 no superan el 0,1 en su poder de detección (10 %), que está muy lejos del 0,80 considerado adecuado. Otro estudio similar ha señado que, para tamaños muestrales entre 30 y 50, la prueba de KS no es capaz de reportar adecuadamente si la distribución de datos sigue o no una distribución normal, por lo que consideramos que para tamaños inferiores a 30 tampoco lo sea (3).

Para tamaños muestrales inferiores a 50, la literatura sugiere usar la prueba de Shapiro-Wilk (SW) y no la KS (4,5). No obstante, el uso de la prueba SW debería restringirse para tamaños muestrales entre 30 y 50 porque presenta problemas cuando el tamaño muestral es menor de 30, ya que suele aceptar la hipótesis nula aun cuando la distribución no sea normal (6). Al comparar entre ambas pruebas, para tamaños muestrales entre 30 y 50, la prueba SW tiende a mostrar una mayor capacidad para detectar la normalidad o no normalidad de la distribución de los datos que la KS (7,8).

Los problemas mostrados por la prueba SW para muestras inferiores a 30 se aprecian en las representaciones gráficas de la distribución de datos como el histograma o el gráfico cuartil -cuartil (Q-Q plot) (4,9). Si tomamos la base de datos que se presenta en la figura 1 y realizamos la prueba SW, nos da un valor p de 0,16154, lo que sugiere normalidad. Sin embargo, al realizar la representación en forma de histograma (las barras deben seguir la distribución de la curva superpuesta) o Q-Q plot (los puntos deben estar sobre la recta) nos damos cuenta de que la distribución no es normal. Asimismo, si en Stata usamos el comando “expand 3” para repetir 3 veces la secuencia de datos para obtener un n = 36 y nuevamente aplicamos la prueba SW, obtenemos un valor p de 0,00417, que señala que la distribución efectivamente no era normal y el problema era el tamaño muestral.

(Fuente: datos obtenidos del artículo: “Frecuencia fundamental en hombres transexuales en diferentes etapas de tratamiento hormonal” de Marsano y colaboradores) (10).

Figura 1. Representación gráfica de datos para establecer la normalidad de una distribución. 

Para n < 30 no es adecuado el uso de pruebas como la KS. Si se decide usar la prueba SW, se recomienda complementar el análisis con el uso de métodos gráficos como histogramas o Q-Q plots (9) antes de tomar la decisión de si se aplicaran o no pruebas paramétricasde análisis.

BIBLIOGRAFÍA

1. Tomás Luiz A, Martín Pozuelo G, González Navarro I, Torales LE, Ponce H, González Barrio R, et al. Influencia de los carotenoides sobre los marcadores de riesgo cardiometabólico en mujeres peri y posmenopáusicas. Nutr Hosp 2021;38(5):993-1001. DOI: 10.20960/nh.03624 [ Links ]

2. Saculinggan M, Balase EA. Empirical Power Comparison of Goodness of Fit Tests for Normality in the Presence of Outliers. J Phys Conf Ser 2013;435:012041. DOI: 10.1088/1742-6596/435/1/012041 [ Links ]

3. Yazici B, Yolacan S. A comparison of various tests of normality, Journal of Statistical Computation and Simulation 2007;77(2):175-83. DOI: 10.1080/10629360600678310 [ Links ]

4. Dropperlmann G. Pruebas de normalidad. Revista Actualizaciones Clínica Meds 2018;2(1):39-43. Disponible en: https://www.meds.cl/wp-content/uploads/Art-5.-Guillermo-Droppelmann.pdfLinks ]

5. Mishra P, Pandey CM, Singh U, Gupta A, Sahu C, Keshri A. Descriptive statistics and normality tests for statistical data. Ann Card Anaesth 2019;22:67-72. DOI: 10.4103/aca.ACA_157_18 [ Links ]

6. Pedrosa I, Juarros-Basterretxea J, Robles-Fernández A, Basteiro J, García-Cueto E. Pruebas de bondad de ajuste en distribuciones simétricas, ¿quéestadístico utilizar? Univ Psychol 2014;14(1):245-54. DOI: 10.11144/javeriana.upsy14-1.pbad [ Links ]

7. Yap B, Sim C. Comparisons of various types of normality tests, Journal of Statistical Computation and Simulation 2011;81(12):2141-55. DOI: 10.1080/00949655.2010.520163 [ Links ]

8. Ahad N, Yin T, Othman A, Yaacob C. Sensitivity of normality tests to non-normal data. Sains Malays 2011;40:637-41. Disponible en: http://journalarticle.ukm.my/2511/Links ]

9. Razali NM, Wah, YB. Power comparisons of shapiro-wilk, kolmogorov-smirnov, lilliefors and anderson-darling tests. Journal of Statistical Modeling and Analytics 2011;2(1):21-33. Disponile en https://www.nrc.gov/docs/ML1714/ML17143A100.pdfLinks ]

10. Marsano-Cornejo MJ, Roco-Videla Á, Bascuñan-Reinoso K, Garrido-Morales V, Gonzalez-Reyes M, Gonzalez-Yañez K, et al. Frecuencia fundamental en hombres transexuales en diferentes etapas de tratamiento hormonal. Rev Investig Logop 2022;12(2):e78276. DOI: 10.5209/rlog.78276 [ Links ]

Conflicto de intereses:

los autores declaran no tener conflicto de interés.

Creative Commons License This is an open-access article distributed under the terms of the Creative Commons Attribution License