INTRODUCCIÓN
Las úlceras por presión (UPP) son consideradas indicadores de la calidad de los cuidados y su aparición es causa de dolor, sufrimiento, aumento significativo de la estancia hospitalaria, deterioro de la calidad de vida e incluso muerte de quienes las padecen1. Países como España han logrado documentar y visibilizar el problema que estas lesiones representan para la salud pública y la seguridad del paciente, de tal manera que, para el año 2014, en este país se señaló una prevalencia en servicios de atención de adultos del 7,87%, cifra que se elevó al 8,51% en mayores de 65 años; en unidades de cuidados intensivos se han notificado valores de hasta el 18%2. En Latinoamérica, el estudio IBEAS reportó una prevalencia de UPP entre el 0,4% y el 15,8%3. Otros estudios han mostrado que la incidencia de estas lesiones puede variar entre el 0,4% y el 38%4,5.
En cuanto a los costos totales de atención de las UPP, en España se ha documentado un gasto anual que puede alcanzar los 461 millones de euros6. Latinoamérica no cuenta con datos sobre el costo de estas lesiones; sin embargo, su intervención forma parte de los objetivos en salud pública de la mayoría de los países de la región. Es así como en Colombia se han desarrollado políticas que incluyen herramientas para la prevención de estas lesiones7, mediante la promoción del uso de una gran variedad de instrumentos de predicción del riesgo, tales como las escalas de Braden y Norton, las cuales tienen amplios reportes de su validez8,9, pero poseen baja evidencia de su eficacia en la prevención de las UPP10,11. Lo anterior motiva la investigación sobre estos instrumentos en la región.
En relación con estas herramientas, la escala de Braden fue presentada como un instrumento de predicción del riesgo de desarrollar UPP en 198712. Está compuesta por 6 ítems: percepción sensorial, movilidad, actividad, humedad, nutrición, fricción y cizallamiento, cada uno de los cuales tiene una categoría de calificación que oscila entre 1 y 4, a excepción del último ítem que puntúa de 1 a 3. La puntuación total de la escala está en el rango de 6 y 23; el punto de corte para determinar riesgo establecido por las creadoras en estudios preliminares fue 16 o menos13. Por su parte, la escala de Norton fue desarrollada por Norton, McLaren y Exton-Smith en el curso de un trabajo con pacientes geriátricos del Reino Unido en 196214. La escala contempla 5 ítems: estado mental, incontinencia, movilidad, actividad y estado físico, los cuales puntúan de 1 a 4 para dar una puntuación total de la escala entre 5 y 20; inicialmente las autoras plantearon como punto de corte para riesgo un valor de 14.
Asimismo, estas escalas tiene un importante número de trabajos de validación11. Sin embargo, existe confusión sobre los resultados publicados, dado que no se informa la escala de referencia sobre la cual se pueden interpretar la sensibilidad y la especificidad. En respuesta a lo anterior, Kraemer planteó calcular los índices para sensibilidad k(1,0) y especificidad k(0,0), los cuales son kappas ponderadas que pueden tomar valores entre 0 y 1, donde 0 representa que la sensibilidad es igual al nivel de la prueba y la especificidad es igual al complemento del nivel de la prueba. En ambos casos, el valor ideal es 1; sin embargo, cualquier valor del índice de calidad de la sensibilidad que supere el nivel de la prueba o índice de calidad de la especificidad que supere el complemento del nivel de la prueba hacen a una prueba legítima15. De acuerdo con lo anterior, y atendiendo a la recomendación de realizar estudios de validación de instrumentos de medición en salud en diferentes contextos16, se planteó desarrollar el presente estudio.
OBJETIVO
Determinar la validez de criterio y los índices de calidad de la sensibilidad, especificidad y eficiencia para de las escalas de Braden y Norton en una cohorte de pacientes adultos hospitalizados en una institución de tercer nivel de atención en Colombia.
MATERIALES Y MÉTODOS
Estudio de validación de tecnologías diagnósticas anidado a un estudio de cohorte. Se realizó el reclutamiento en los servicios de urgencias, cirugía general y quirófanos de un hospital público de mediana y alta complejidad de atención, en Bucaramanga (Colombia). En dichas unidades se realiza la admisión de los pacientes a la institución hospitalaria. Los criterios de inclusión fueron: tener una edad mayor de 18 años e indicación de hospitalización. Se excluyó a los participantes que presentaron UPP al ingreso o en quienes no fue posible obtener información completa de las escalas de Braden y Norton; la muestra se seleccionó de forma no probabilística y se conformó a través de reclutamiento censal durante los meses de noviembre y diciembre de 2010.
Recolección de datos e instrumentos
El equipo de investigación estuvo dividido en dos grupos de profesionales de enfermería, con entrenamiento en la aplicación de las escalas y manejo de eventos adversos; un grupo se encargó de la valoración inicial y el segundo fue responsable del seguimiento, identificación, registro de características y factores contribuyentes de las UPP.
Durante las primeras 24 a 36 horas de participación en el estudio se aplicó a cada participante un instrumento que recogió datos generales, condiciones clínicas, factores contributivos y medidas de prevención para la aparición de eventos adversos ejecutadas por el personal asistencial externo al estudio, como parte de los cuidados brindados a los pacientes durante su estancia en la institución, dentro de las cuales se encontraban la valoración del riesgo de desarrollar UPP, aplicación de hidratantes, masajes, hidrocoloides y/o sistemas de protección local, cambios de posición y uso de superficies antiescaras; asimismo, en esta primera evaluación por parte del equipo investigador se evaluó el riesgo de desarrollar UPP a través de las escalas de Braden12 y Norton14. A partir del segundo día, cada participante recibió visita diaria por el equipo investigador asignado para esta labor, con el fin de identificar UPP; cada participante fue seguido hasta el egreso hospitalario o muerte.
Para identificar las UPP (patrón de referencia), las enfermeras siguieron los estadios descritos en el Consenso de National Pressure Ulcer Advisory Panel (NPUAP)17, así:
Estadio I. Alteración observable en la piel íntegra, relacionada con la presión, que se manifestó por un eritema cutáneo que no palidecía al presionar; en pieles oscuras, podían identificarse tonos rojos, azules o morados.
Estadio II. Pérdida parcial del grosor de la piel que afectó a la epidermis, dermis o ambas. Úlcera superficial con aspecto de abrasión, ampolla o cráter superficial.
Estadio III. Pérdida total del grosor de la piel que implicó lesión o necrosis del tejido subcutáneo, que podía extenderse hacia abajo, pero no por la fascia subyacente.
Estadio IV. Pérdida total del grosor de la piel con destrucción extensa, necrosis del tejido o lesión en músculo, hueso o estructuras de sostén (tendón, cápsula articular, etc.). En este estadio, como en el estadio III, podían presentarse lesiones con cavernas, tunelizaciones o trayectos sinuosos.
Procesamiento y análisis de la información
La información fue recolectada en formularios físicos, los cuales fueron validados por doble digitación en el programa EpiData 3.1. El análisis de las escalas y características sociodemográficas de los participantes se realizó en Stata v12.0.
La incidencia acumulada de la primera UPP se calculó como el porcentaje de participantes que cumplieron con la definición de este evento, sobre el total de participantes libres de UPP al ingreso en el estudio; asimismo, para este estadístico se calculó un intervalo de confianza al 95%. Se evaluó la normalidad de las variables a través del test Shapiro Wilk, las variables continuas, de acuerdo con su distribución se presentaron con medias y desviación típica (DT) o medianas y rango intercuartil (RI); las variables categóricas se reportaron con frecuencias absolutas y relativas. Para evaluar las diferencias en edad y sexo por los grupos de personas con y sin UPP, se realizó la prueba U de Mann-Whitney y la prueba χ² respectivamente, teniendo en cuenta un nivel de 0,05.
Para evaluar la validez predictiva de las escalas se calculó el área bajo la curva de Receiver Operator Curves (ROC). Se analizaron cada uno de los puntos de corte de las puntuaciones totales de las escalas con respecto a la presencia de UPP (patrón de referencia), determinándose la sensibilidad (S), especificidad (E), valor predictivo positivo (VPP) y negativo (VPN), razones de verosimilitud positivas y negativas (LR+ y LR-) y eficiencia.
Siguiendo las recomendaciones de Kraemer15, los test estadísticos (coeficientes Kappa) se presentaron como índices de calidad de la sensibilidad k(1,0), especificidad k(0,0) y eficiencia k(0,5;0). Estos índices aportan información para la interpretación y selección de un punto de corte óptimo de acuerdo con los propósitos de evaluación de sensibilidad (tamizaje), especificidad (diagnóstico diferencial) o eficiencia (acuerdo general). Valores de 0,55 o mayores pueden ser interpretados como un acuerdo aceptable18; por último, se calculó el riesgo relativo bruto para cada uno de los puntos de corte.
Aspectos éticos: El estudio (FFEA) contó con la aprobación del Comité de Ética para la Investigación Científica de la Facultad de Salud de la Universidad Industrial de Santander (Bucaramanga, Colombia), siguió los principios de la declaración de Helsinki y solicitó consentimiento informado a todos los participantes.
RESULTADOS
Se evaluaron 938 personas mayores de 18 años. Tras realizar la prueba Shapiro Wilk, se rechazó la hipótesis de normalidad para todas las variables generales y puntuaciones de las escalas. La mediana de edad fue de 53 años RI (36 años), el 56,64% (n = 529) de los participantes pertenecían al sexo masculino y el mayor porcentaje de la población (26,18%) se encontraba en el rango de edad comprendido entre los 70 y 94 años (Tabla 1). Las mujeres presentaron una mediana de edad mayor que la de los hombres, 60 años RI (36 años) y 46 años RI (37 años), respectivamente (Mann-Whitney p < 0,001); por otra parte, las medidas preventivas de UPP más frecuentemente administradas a los participantes del estudio fueron la realización de cambios posturales con el 28,3% y valoración del riesgo con el 15,9%; las demás acciones no superaron una frecuencia del 2% en la población de estudio.
Un total de 49 personas desarrollaron una UPP durante el seguimiento, lo cual representa una incidencia acumulada de 5,1% (intervalo de confianza [IC] al 95%: 3,6-6,4). El 47,0% (n = 23) de las UPP se clasificaron en el estadio II, el 42,9% (n = 21) en el estadio I y el 10,2% (n = 5) en el estadio III. La aparición de estas lesiones fue más frecuente en mujeres, como se presenta en la Tabla 2. Por otra parte, se observó que la mediana de edad en el grupo de personas que presentaron UPP fue mayor que la del grupo de personas libres de UPP durante el seguimiento (Tabla 2).
Por otra parte, al calcular y comparar los índices obtenidos para ambas escalas desde la perspectiva del patrón de referencia, se observó que los mayores niveles de sensibilidad se obtienen con los puntos de corte 17 Norton y 18 Braden, la especificidad de las escalas en su mayoría superó el valor de 60%, a excepción de las puntuaciones 17 y 16 de la escala de Norton y 18 de la escala de Braden; en este sentido, se destaca que ninguna de las escalas mostró un buen desempeño en los puntos de corte originales definidos por las autoras, como se muestra en la Tabla 3.
E: especificidad; LR+: razón de verosimilitud positiva; LR-: razón de verosimilitud negativa; S: sensibilidad; VPP: valor predictivo positivo; VPN: valor predictivo negativo.
Asimismo, los índices relacionados con los valores totales del test mostraron puntuaciones bajas, especialmente en los VPP, puesto que los VPN fueron superiores al 95% (Tabla 3). En el análisis ROC, nuevamente los puntos de corte 17 Braden y 18 Norton presentaron los mayores valores de AUC, alcanzando un valor de 0,74 (IC 95%: 0,68-0,79) y 0,64 (IC 95%: 0,60-0,69), respectivamente (Fig. 1).
Adicional a lo anterior, se evaluó la concordancia entre el patrón de referencia y la clasificación dada por las escalas (eficiencia) y el porcentaje de positivos identificados según Braden y Norton (nivel de la prueba) para cada punto de corte como se muestra en la Tabla 4. En este mismo sentido es importante resaltar que los índices de calidad de los puntos de corte con el mejor rendimiento para la sensibilidad presentaron valores de índices de calidad k(1,0) superiores a 0,70, y fue la escala Braden la que obtuvo el mayor valor, contrariamente a lo observado en los índices de calidad para la sensibilidad y especificidad, en donde los valores fueron inferiores a 0,21, como se muestra en la Tabla 4.
DISCUSIÓN
De acuerdo con el objetivo de tamización del riesgo de desarrollar UPP de la escalas evaluadas, el presente trabajo procuró identificar un punto de corte con una sensibilidad óptima, acompañado de valores de sensibilidad no inferiores al 60% con el fin de lograr un balance entre la captación de la mayoría de personas a riesgo y la moderada asignación de recursos a personas que no estén a riesgo; estos criterios en su conjunto, con la información aportada por los índices de calidad expresados como coeficientes Kappa, permitieron identificar los puntos de corte 18 Braden y 17 Norton con índices de calidad para la sensibilidad superiores a 0,55, como los valores que cumplían los criterios anteriormente descritos.
De acuerdo con los hallazgos anteriores, este trabajo presenta evidencia que apoya el uso de puntos de corte diferentes a los originales en poblaciones adultas de amplio rango etario; en el caso de la escala de Braden, las autoras, habían reportado el punto de corte de ≤17 en un estudio con adultos mayores de 50 años19. Por otra parte, la frecuencia de UPP mencionadas en el presente estudio que involucró a personas con un amplio rango de edad se aproxima a las señaladas en adultos mayores20.
La escala de Braden en diferentes puntos de corte ha reportado valores de sensibilidad en rangos de 85,7% hasta 100% y especificidad de 70% a 85,7%12,21,22 y para la escala de Norton valores entre 33,9% y 100% y 50% a 62,7%23, respectivamente. Los valores de sensibilidad de las escalas en el presente trabajo fueron satisfactorios; sin embargo, se observó una limitada capacidad predictiva que puede estar mediada por la administración de intervenciones preventivas después de la evaluación con las escalas, hecho que modifica la frecuencia de aparición de las UPP y por ende las propiedades que se reportan de este tipo de instrumentos23. En este mismo sentido, es importante destacar que otros autores han mencionado los bajos valores predictivos de estas escalas, en especial ante la presencia de bajas prevalencias24,25 como fue el caso de este estudio.
Por último, es importante destacar que se observaron excelentes26) valores de AUC Norton [0,816] y Braden [0,810], los cuales superaron los mencionados para escalas administradas bajo las condiciones normales de atención por enfermería23. Al igual que un estudio en una población de adultos mayores27, en el presente trabajo se identificó una mayor frecuencia de UPP en el grupo de mujeres, quienes a su vez presentaron mayor edad, hallazgo que en el contexto de poblaciones heterogéneas pone de manifiesto la necesidad de evaluar la edad como un factor de riesgo28.
De acuerdo con la evidencia presentada en este trabajo, se reitera la importancia de conocer el funcionamiento de instrumentos como las escalas de Braden y Norton en poblaciones específicas, y se invita a la enfermera a indagar, analizar e incorporar en su criterio clínico las propiedades psicométricas de las escalas de valoración para lograr una interpretación crítica de sus resultados y una toma de decisiones acorde a las características individuales de las personas sujetos de cuidado.
CONCLUSIONES
En el presente estudio, la escala de Braden presentó el mejor balance entre los valores de sensibilidad, especificidad y calidad de la sensibilidad, lo cual, a pesar de sus limitaciones, la posiciona como una escala válida para la medición del riesgo de desarrollar UPP en pacientes adultos. Se hace necesario que futuras investigaciones evalúen los puntos de corte aquí identificados y se evalúen los factores que pueden contribuir a mejorar los valores de especificidad. Por último, se alienta a implementar los índices de calidad como una forma de evaluación de las probabilidades comúnmente empleadas para la validación de criterio.