INTRODUCCIÓN
La investigación cuantitativa aporta a la disciplina de enfermería y a otras ciencias de la salud: evidencia objetiva acerca de la descripción de poblaciones por medio de análisis muestrales y a la vez, según su diseño metodológico, realiza asociaciones entre variables.(1) De esta forma, permite identificar, seleccionar e interpretar de manera crítica la evidencia para actuar correctamente ante problemas de salud.(2) Ante esto, se debe tener en cuenta que en salud la respuesta que se asocia a una variable va a depender del diseño utilizado, por ello se debe apostar en lo posible a un trabajo y análisis multivariado teniendo en cuenta que muchas veces los resultados no pueden ser interpretados como absolutos.(3)
Uno de los objetivos de la investigación en enfermería es permitir la aplicación de los resultados a la práctica clínica, lo que hemos llamado (junto a la capacidad de elección del usuario, el juicio clínico del profesional y los recursos disponibles) Practica Basada en Evidencia (PBE).(4) Para ello, requerimos que los resultados que se obtienen en las fuentes primarias sean correctamente interpretados. Un estudio realizado en China recientemente muestra que a pesar que las enfermeras tienen buena disposición al pensamiento crítico, existe un bajo nivel de competencia en la investigación de enfermería.(5)
Entonces, a pesar de que la investigación cuantitativa forma parte de la formación de las enfermeras en metodología de la investigación, muchas veces existen errores o falsas interpretaciones en torno al valor p (probabilidad de que los resultados sean efectos del azar) o a las medidas de efecto como Riesgo Relativo (RR) ú Odds Ratio (OR). Este problema no sólo se produce en la investigación biomédica (dentro de la cual está la investigación en cuidados) si no que es abarca todas ciencias donde se aplica la interpretación de datos cuantitativos. Si bien, esta publicación hace referencia a análisis inferenciales (valor p - RR - OR) en razón a sus conclusiones, sin embrago no es menor el análisis que el investigador debe hacer en las investigaciones en su apartado de estadística descriptiva, en donde se deben mencionar si los datos tienen una distribución normal. Con ello, la utilización del estadígrafo media con su respectiva desviación estándar, en caso contrario si los datos no son normales (no paramétricos) realizar estadígrafos de posición como mediana y moda y/o gráficos de caja. A veces, esto es ejecutado en forma imprecisa, como ejemplo colocar valores de media sin su desviación o error estándar, colocar valores y graficas con promedios siendo que los valores presentan una distribución normal.
El presente trabajo tiene como objetivo identificar las principales interpretaciones del valor de p y las medidas de efecto, (RR - OR) aplicado en investigaciones del ámbito de la enfermería, a modo de guía para la mejor toma de decisiones en nuestra disciplina.
HIPÓTESIS Y VALOR DE P
El valor de p (probabilidad), es utilizado como prueba de significancia para dar respuestas a la hipótesis nula(6) en la aplicación de estadística inferencial (rechazar o aceptar la hipótesis nula). Así, en estadística inferencial, se formulan dos hipótesis: la hipótesis nula (H0) y la alternativa (H1). En la H1 siempre se establece que hay diferencias o no hay relación entre las variables que se comparan o se relacionan según el modelo estadístico a utilizar y definiendo el estadístico de contraste, a diferencia de H0 que indica que las variables sean iguales o que no hay relaciones, se esta forma éstas son excluyentes entre sí, en relación a la variable (característica poblacional) a estudiar. Como ejemplo de estadísticos de contraste tenemos t de Student(7) Fisher (y)(8,9) y Pearson (x)(10) entre otros, los cuales se usan para análisis paramétricos (variables con distribución normal) y para análisis no paramétricos (variables sin distribución normal) como ejemplo Kruskal Wallis(11), Friedman(12), Wilcoxon(13), entre otros. Aunque este tema no es lo particular a desarrollar de esta publicación, se invita al lector a indagar en estos aspectos necesarios para la decisión de que análisis estadístico aplicar según su diseño metodológico.
Antes de la aplicación de las hipótesis estadísticas, se debe tener plateada la pregunta de investigación, de esta forma y como se mencionó en el párrafo anterior realizar el diseño estadístico al cual le corresponderá una hipótesis precisa. Para contextualizar, leamos estos ejemplos en donde las preguntas e hipótesis planteadas son:
- ¿es igual el Índice de Masa Corporal (IMC) en población de adulto mayor entre hombres y mujeres? (análisis de comparación), su Hipótesis nula, será: la media poblacional del IMC es igual entre hombres y mujeres;
- ¿Se relaciona la fuerza muscular de ejercicios realizados con los índices glicémicos de jóvenes entre 20 y 30 años? (regresión), su Hipótesis nula: No hay relación entre los índices glicémicos de jóvenes entre 20 y 30 años.
Resumiendo, entonces, para dar respuesta a estas preguntas de investigación generadas, se aplicaron análisis estadísticos correspondientes de los cuales se levantaron las hipótesis; finalmente para la verificación y validez de aprobar o rechazar la Ho se verifica con el valor de p (resultante del análisis estadístico), el cual nos explica si las diferencias observadas entre los resultados son producto del azar, por medio de la identificación de la hipótesis planteada.
El valor de p nos permite proporcionar una medida de confiabilidad en términos de probabilidad, la cual va de 0 a 1 (proporción),(14) y la decisión estará determinada por el nivel de significancia previamente establecido por el equipo de trabajo. En bioestadística se debe asumir que nunca hay un 100% de certeza en los resultados dado que todos los procesos son multivariados. Como ejemplo, lo más común en investigaciones en salud es trabajar con un 95% de certeza, donde hay un 5% de error(15) (usted acepta un 5% de estar equivocado al rechazar la Ho), en donde el valor límite para decisión de su p sería 0,05. Otra alternativa menos frecuente es trabajar con un 99% de certeza y un 1% de error, donde el valor límite de decisión para su p sería 0,01 (figura 1). En forma didáctica, las autoras han generado un esquema visual, en donde el lector de literatura científica, sin saber conceptos matemáticos, puede de forma fácil identificar que hipótesis se está aprobando. (Figura 1)
Haciendo mención del párrafo anterior en donde se hace referencia a que los procesos son multivariados, se coloca el siguiente ejemplo: si se busca la relación ente la diabetes y la ingesta de carbohidratos, otras variables a estudiar dentro del análisis relacional podrán ser la edad, tipo de carbohidratos, hora de consumo; sin embargo quedarán variables sin identificar en nuestro diseño que podrían ser: antecedentes familiares de diabetes mellitus y frecuencia de consumos de carbohidratos.
Habiendo explicado el proceso de hipótesis y el valor de p como resultante de la validez de los resultados, es necesario que el lector analice su diseño metodológico, dado que el valor de p (calculado a partir de los test de probabilidad, paramétricos y no paramétricos) se ve afectado en distintas situaciones generando errores en la aceptación o rechazo de la Ho. En este sentido: Situación 1: - hacer análisis con valores pequeños de Alpha (∝) (<0,05) lo cual provoca un error Tipo I o llamado también Alpha (probabilidad de ocurrencia Alpha) o falso positivo, en donde el investigador rechaza la hipótesis nula, siendo que es verdadera. Situación 2: - en diseños metodológicos mal estructurados en donde el tamaño muestral no es el adecuado (bajo) que pueden llevar a errores de falsos negativos, llamado error de Tipo II o beta (β)(15). Los valores alpha y beta están dados por la región critica de rechazo de la Ho, de esta forma visto el resultado bajo la mirada del valor del estadígrafo de contraste (no del valor p), si cae en la región critica, se rechaza Ho(15). Para ejemplificar lo que puede significar ponemos el siguiente ejemplo de Ho: Dos intervenciones de enfermería tienen la misma eficacia, Ha: las intervenciones de enfermería no tienen la misma eficacia; un error de tipo I sería que el investigador rechaza Ho, concluyendo que son distintos, ante este ejemplo el paciente igualmente se estaría beneficiando de una o de otra intervención, sin embrago, en el error tipo II, el investigador no rechaza la hipótesis nula, dice que ambas intervenciones son iguales, es probable que esto genere un déficit de cuidados en el paciente, determinando que una intervención es mejor que la otra.
Con los conceptos ya aclarados de hipótesis y el valor de p, ahora ejemplifiquemos la forma de dar respuesta a nuestras hipótesis planteadas en el diseño experimental. En la Tabla 1, se muestran los resultados de un estudio retrospectivo que busca asociar el timing de administración de antibióticos (en un grupo se administró el antibiótico en menos de 15 minutos y el otro entre 15 a 60 minutos antes de la incisión quirúrgica) con la infección del sitito quirúrgico en cirugías de pie y tobillo(16). En su análisis está la variable edad, podemos generar una hipótesis nula sobre la variable edad planteándola de la siguiente forma: ¿es la edad igual en los grupos de tratamientos de análisis? (dado que se probarán dos grupos). En la tabla 1 menciona que para la edad tiene un p <0,05, por lo tanto, se aprueba la hipótesis alternativa (figura 1), de esta forma se concluye que existe una diferencia significativa en ambos grupos de tratamiento para la edad. De esta forma, para ambos casos estamos diciendo que la diferencia es segura en un 95% por ciento y que no es por azar. Por otro lado, la variable tipo de fumador, arrojó un p=0,07, aprobándose la hipótesis nula (Figura 1), es así entonces, que la muestra (no fuma, anteriormente fumó, fumador actual), es igual en ambos grupos que se expondrán al tratamiento. Por lo tanto, podemos decir que no podemos rechazar Ho (hipótesis nula), entonces los datos podrían estar asociados al azar ó con un 95% de confianza (según lo elegido por los investigadores) no hay diferencias significativas entre los tipos de fumadores.
Ante lo expuesto, el "valor de p", debe ser concordante con el diseño de estudio realizado, tener precaución con la interpretación que podría afectar las decisiones en prácticas clínicas. Por ello, es que se usan además las medidas de efecto como el Riesgo Relativo (RR) y el Odds Ratio (OR) que pueden dar respuesta a la relevancia clínica de magnitud de diferencia entre dos variables(17,18)
Con todo el análisis entregado el valor p debe ser interpretado con cautela. Si bien el consenso de nivel de significancia del 95% de certeza a un efecto o un estudio da cierta seguridad, puede ser influido por otros factores que pueden no haber sido considerados en la investigación. En este contexto, es que se indica que dar demasiada importancia al pvalor puede conducir de forma equivocada a lo que se ha denominado el “p hacking”, en referencia al manejo de datos hasta que los resultados pasen del error estadístico.(19)
MEDIDAS DE EFECTO: RR
El riesgo relativo (RR) es una medida de efecto ya que representa la relación entre dos variables. Se usa habitualmente para expresar la probabilidad de que los individuos de un grupo que tuvieron la exposición a un factor presenten un efecto o una enfermedad.(20) Esta exposición, puede constituirse en un factor de riesgo o un factor protector, de acuerdo con el valor que presente. Por lo tanto, el RR lo que hace es comprar el “riesgo” de tener un determinado efecto o resultado (por ejemplo, una enfermedad) al estar “expuesto” o “no expuesto” a un determinado factor. Para efectos de cálculo, se calcula dividiendo la incidencia (los casos nuevos) en los expuestos/ no expuestos. Un ejemplo para este cálculo es el trabajo de parto como factor de riesgo para la endometritis en la operación cesárea.(21) En las pacientes con cesárea con trabajo de parto si la tasa de endometritis es del 0,5% y la tasa de endometritis en pacientes con cesárea sin trabajo de parto es del 0,1% el riesgo se calcularía 0,5/0,1= 5. Esto significa que el riesgo de presentar endometritis es 5 veces mayor en las pacientes de cesárea con trabajo de parto que las que no tienen trabajo de parto. Este factor de riesgo es dependiente de la atención, por lo que un adecuado manejo y control del embarazo pueden ayudar al control de la endometritis.
En esta expresión, otro punto importante es el intervalo de confianza. En las investigaciones de salud comúnmente se usa el 95% de confianza (es decir se admite un 5% de error.) En el ejemplo anterior si el RR de endometritis con trabajo de parto es de 5.0 podríamos plantear un IC 95% (4,1-5,8). Este intervalo de confianza se interpreta como que existe un 95% de probabilidades que el resultado real para el riesgo de endometritis con trabajo de parto se encuentre entre 4,1 y 5,8.
La interpretación del RR se debe hacer según los valores que se muestran en la tabla 2.
Cuando en una investigación el RR es de 1.0 (o su intervalo de confianza pasa por el valor 1.0) no se puede determinar si el factor de exposición es un factor de riesgo o protector, por lo que su efecto se anula. Entonces, si por ejemplo en una investigación se determina que el consumo habitual de un determinado aceite presenta un RR de 1.0 para dislipidemia, entonces decimos que el efecto es nulo: el consumo habitual de este tipo de aceite puede, o no puede, relacionarse con la dislipidemia.
Por otro lado, los factores también pueden ser protectores. Es el caso de una revisión con metaanálisis(22) que muestra la eficacia de las intervenciones de enfermería en recaídas de pacientes con falla cardiaca. En este estudio las visitas domiciliarias de enfermería en relación con atención estándar tienen un RR 0,78 con IC 95% (0,62-0,98), así, las visitas de enfermería domiciliarias se constituyen en un factor protector para el reingreso de pacientes con falla cardiaca previa.
En otro ejemplo, una revisión sistemática con metaanálisis revisa la mortalidad por todas las causas en lactantes de 0 a 5 meses con relación al antecedente de lactancia materna.(23) En los lactantes alimentados parcialmente con lactancia materna el RR de mortalidad fue de 2,84 IC al 95% (1,63-4.97) mientras que en los que no se amamantaron el RR fue de 14,4 IC al 95% (61.3-33.9). En este caso la interpretación es que la lactancia materna sin duda es un factor protector para la mortalidad por cualquier causa. En los lactantes parcialmente amamantados el efecto es menos marcado que en aquellos que no reciben lactancia materna que tienen 14,4 veces más riesgo de morir por cualquier causa que aquellos que si son amamantados. De aquí, la importancia de las actividades de fomento de la lactancia materna por parte de enfermería.
MEDIDAS DE EFECTO: OR
El Odds ratio (OR) no tiene una traducción exacta al español. Se traduce como razón de odds, razón de momios o razón de probabilidades. En resumen, es el cociente entre la probabilidad que un evento ocurra y la probabilidad que no ocurra.(24)
El OR es usado frecuentemente en estudios de casos y controles y estudios retrospectivos. Los estudios de casos y controles son estudios observacionales y retrospectivos, donde a contar de la presencia o no de un desenlace (enfermedad, por ejemplo) se observa la exposición a determinados factores. Los casos son individuos que tienen la enfermedad o desenlace y los controles son sujetos con similares características pero que no tienen el desenlace o enfermedad. Un metaanálisis que agrupó 8 estudios de casos y controles(25) determinó que la lactancia materna es un factor protector para la muerte súbita del lactante OR 0,61 IC 95% (0,42-0,87) La forma de interpretar estos resultados es que existe una asociación negativa entre la lactancia materna y la muerte súbita del lactante (por lo tanto, la lactancia materna es un factor protector)
Para interpretar los valores OR es necesario guiarse por los valores de la tabla 3.
Valor del OR | Interpretación |
---|---|
1 | Efecto nulo |
>1.0 | Asociación positiva entre las variables |
<1.0 | Asociación negativa entre las variables |
Otro ejemplo de estudio realizado por enfermería es un estudio de casos y controles realizados en Irán.(26) Los casos son mujeres que han tenido una intención suicida y los controles fueron emparejados de acuerdo con edad y otras características demográficas (pero sin intención suicida). Las variables más importantes fueron el antecedente de infidelidad (OR 44,57 IC 95% 6,08-3,6,63) y la violencia ejercida por el marido (OR 37,01, IC del 95%: 11,54 a 118,67). Entonces entre las variables infidelidad y violencia ejercida por el marido existe una asociación positiva con la intención suicida de la mujer. Las intervenciones de enfermería en este caso debieran apuntar a estrategias multidisciplinarias, con énfasis en la intervención en crisis.
En otro ámbito, la trombosis venosa profunda es una complicación para pacientes que tienen una larga estadía hospitalaria. En un estudio multicéntrico de caso y controles se investigó la asociación entre la estadía hospitalaria, y otros factores con Trombosis venosa Profunda (TVP).(27) En este estudio hecho en 23.985 pacientes se determinó que para hospitalizaciones menores a 4 semanas la mayor edad (OR 1,027 IC 95% 1,013-1,041) y la estadía en un piso quirúrgico (OR 2,527 IC 95% 1,541-4,144) fueron los factores que se asociaron positivamente con la TVP. Además, factores independientes se asociaron significativamente con la incidencia de TVP en estadías de 5 a 8 semanas: sexo femenino (OR 4,270 IC 95% 1,227-14,862), tabaquismo (OR = 10,860; IC 95%: 2,130-55,370). Estas observaciones son fundamentales, ya que tenemos factores que son modificables y sobre los cuales enfermería puede actuar: tabaquismo y la mayor estadía hospitalaria. Actuar sobre estos factores puede sin duda disminuir el riesgo de complicaciones como la TVP que aumentan los días cama y el gasto en salud pública.