Sr. Editor:
En la metodología de la publicación de Tomás y colaboradores (1) se declara haber trabajado con 12 sujetos utilizando la prueba de Kolmogorov-Smirnov (KS) para determinar si los datos seguían o no una distribución normal. Queremos hacer algunas observaciones respecto al uso de pruebas para evaluar la distribución de datos y la sensibilidad que presentan al tamaño muestral. Cuando contamos con menos de 50 unidades, no se recomienda utilizar la prueba de KS porque presenta un bajo poder para detectar la no normalidad de los datos (2). Saculinggan y colaboradores (2) analizaron el poder de detección de la no normalidad en muestras con n = 10, hasta n = 60, donde las de tamaño 10 no superan el 0,1 en su poder de detección (10 %), que está muy lejos del 0,80 considerado adecuado. Otro estudio similar ha señado que, para tamaños muestrales entre 30 y 50, la prueba de KS no es capaz de reportar adecuadamente si la distribución de datos sigue o no una distribución normal, por lo que consideramos que para tamaños inferiores a 30 tampoco lo sea (3).
Para tamaños muestrales inferiores a 50, la literatura sugiere usar la prueba de Shapiro-Wilk (SW) y no la KS (4,5). No obstante, el uso de la prueba SW debería restringirse para tamaños muestrales entre 30 y 50 porque presenta problemas cuando el tamaño muestral es menor de 30, ya que suele aceptar la hipótesis nula aun cuando la distribución no sea normal (6). Al comparar entre ambas pruebas, para tamaños muestrales entre 30 y 50, la prueba SW tiende a mostrar una mayor capacidad para detectar la normalidad o no normalidad de la distribución de los datos que la KS (7,8).
Los problemas mostrados por la prueba SW para muestras inferiores a 30 se aprecian en las representaciones gráficas de la distribución de datos como el histograma o el gráfico cuartil -cuartil (Q-Q plot) (4,9). Si tomamos la base de datos que se presenta en la figura 1 y realizamos la prueba SW, nos da un valor p de 0,16154, lo que sugiere normalidad. Sin embargo, al realizar la representación en forma de histograma (las barras deben seguir la distribución de la curva superpuesta) o Q-Q plot (los puntos deben estar sobre la recta) nos damos cuenta de que la distribución no es normal. Asimismo, si en Stata usamos el comando “expand 3” para repetir 3 veces la secuencia de datos para obtener un n = 36 y nuevamente aplicamos la prueba SW, obtenemos un valor p de 0,00417, que señala que la distribución efectivamente no era normal y el problema era el tamaño muestral.
(Fuente: datos obtenidos del artículo: “Frecuencia fundamental en hombres transexuales en diferentes etapas de tratamiento hormonal” de Marsano y colaboradores) (10).
Para n < 30 no es adecuado el uso de pruebas como la KS. Si se decide usar la prueba SW, se recomienda complementar el análisis con el uso de métodos gráficos como histogramas o Q-Q plots (9) antes de tomar la decisión de si se aplicaran o no pruebas paramétricasde análisis.