INTRODUCCIÓN
El Padrón Continuo, elaborado por el Instituto Nacional de Estadística, estima que el 20,75% de los españoles tiene 65 años o más, lo que sitúa a España como el tercer país europeo con mayor media de edad1. El envejecimiento de la población en los países industrializados es consecuencia del descenso de la natalidad, el aumento de la esperanza de vida y la disminución de la mortalidad. El descenso de la natalidad solo tiene un efecto estadístico, pero el incremento de la esperanza de vida y el descenso de la mortalidad llevan aparejada la probabilidad de adquirir trastornos crónicos y de padecer discapacidades que con el tiempo resulten en dependencia2.
La independencia funcional se ha definido como el desempeño de las tareas de cuidado personal sin supervisión, dirección o asistencia personal activa3, mientras que por dependencia se entiende el estado en el que se encuentran las personas que, por razones ligadas a la falta o pérdida de autonomía física, psíquica o intelectual, tienen necesidad de asistencia o ayuda importante para realizar las actividades de la vida cotidiana4. Dos de cada tres personas en situación de dependencia en España tienen 65 años o más, y dos tercios de ellas son mujeres5.
Los estudios poblacionales permiten examinar las condiciones de salud de una población en un tiempo y lugar definidos6. Aunque este tipo de estudios no está exento de sesgos y riesgos7, permiten acceder a datos que no se pueden obtener de otro modo y suponen una aproximación a la realidad y la toma de decisiones en políticas de salud. La Encuesta Nacional de Salud de España 20178 utiliza una batería de más de 20 preguntas para conocer las limitaciones físicas, sensoriales y cognitivas, así como para la realización de las actividades de la vida cotidiana.
Para explorar la prevalencia de dependencia funcional en personas mayores se dispone de un buen número de instrumentos, partiendo cada uno de ellos de una conceptualización particular del problema. Por ejemplo, la escala de Katz9 explora las actividades básicas de autocuidado en la vida diaria y se desarrolló como un índice ordinal para evaluar el funcionamiento físico en los ancianos. La escala de Lawton10 se diseñó para evaluar las habilidades de vida independiente necesarias para vivir en la comunidad, incluidas tareas más complejas y sensibles que las actividades básicas. Estas dos escalas son probablemente las más utilizadas en estudios clínicos11. Una revisión sistemática exploró el uso y las propiedades psicométricas de pruebas de screening en atención primaria que detecten fragilidad en ancianos, y constató la existencia de 11 estudios bien diseñados que utilizaron 10 cuestionarios diferentes12. De entre ellos, el que obtiene mejores valores de sensibilidad y especificidad es el cuestionario de Barber13, 0,95 y 0,68, respectivamente.
El cuestionario de Barber14 consiste en 9 preguntas, cada una representa un aspecto importante de la salud y el bienestar, y la respuesta “sí” a cualquiera de ellas se considera un indicador de un estado de riesgo, fragilidad o vulnerabilidad, por lo que el paciente requeriría de una evaluación más completa. Algunos estudios encuentran aceptables evidencias de validez clínica para el cuestionario de Barber, aunque superados por los de otras pruebas15, mientras que otros lo consideran poco útil en patologías como el cáncer16. A pesar de estas posibles limitaciones, es una de las pruebas más utilizadas en atención primaria y en múltiples estudios clínicos17,18,19,20.
Ninguno de los trabajos encontrados utiliza el cuestionario de Barber en estudios poblacionales. Este tipo de estudios carece de los problemas que puede presentar el uso en la clínica, limitándose a clasificar a los sujetos en situación de fragilidad, vulnerabilidad o riesgo de dependencia funcional.
OBJETIVOS
El presente estudio tiene por objetivo explorar las propiedades psicométricas del cuestionario de Barber (evidencias de validez basada en la estructura interna y con base en la relación con otras variables de tipo convergente y discriminante), así como la relación entre las puntuaciones obtenidas en esta prueba y variables sociodemográficas de salud en una muestra representativa de una gran ciudad.
METODOLOGÍA
Participantes
Se obtuvo una muestra de 1.882 sujetos, 735 hombres y 1.147 mujeres. La media de edad fue de 74,0 años (desviación estándar [DE]: 5,9; rango: 66-98), 73,7 (DE: 5,7) para los hombres y 74,3 (DE: 6,1) para las mujeres. En la tabla 1 se resumen los descriptivos de la muestra.
Instrumentos
El cuestionario de Barber14, versión española21, consta de 9 ítems que se responden dicotómicamente sí/no, de modo que la respuesta afirmativa a un solo ítem se interpreta como fragilidad, vulnerabilidad o riesgo de dependencia funcional. No se dispone de estudios que exploren su aplicabilidad en estudios epidemiológicos.
El COOP/WONCA22 es un instrumento para estimar la calidad de vida relacionada con la salud (CVRS), versión adaptada al español23, que utiliza los contenidos de cada ítem como estímulos verbales, prescinde de las láminas y se realiza mediante entrevista telefónica, modalidad ya estudiada y que presenta buenos resultados24. Aunque se han utilizado versiones de 6, 7 y 9 ítems, para el presente estudio se optó por la versión más amplia, la de 9 ítems, para facilitar la comparabilidad de los resultados con estudios previos25. Las puntuaciones se trataron como una escala Likert de 5 anclajes, a mayores puntuaciones peor calidad de vida.
El Cuestionario General de Salud de 12 ítems (GHQ-12), versión española26, es un instrumento de cribado cuyo objetivo es detectar indicadores de malestar psicológico y posibles casos de trastornos psicopatológicos (no psicóticos) en contextos como la atención primaria o en población general. Los ítems se responden en una escala tipo Likert de 4 opciones. La corrección puede efectuarse de dos formas: GHQ-Likert, puntuaciones entre 0 y 3, en que puntuaciones mayores corresponden a peores indicadores de salud mental, y puntuación criterial GHQ, que asigna los valores 0, 0, 1, 1 a las respuestas de los ítems. Estudios previos muestran que una puntuación criterial de 3 o más respuestas afirmativas indica riesgo de mala salud mental27.
Para estimar la salud percibida se realizó la pregunta: en los últimos 12 meses, ¿diría que su estado de salud ha sido muy bueno, bueno, regular, malo, muy malo? Se administró una serie de preguntas sobre la existencia de quejas subjetivas de memoria: ¿tiene usted problemas de memoria?, ¿desde hace cuánto tiempo tiene usted problemas de memoria?, ¿desde hace cuánto tiempo tiene usted problemas de atención o dificultad para concentrarse?, ¿le preocupan estos problemas de atención o de memoria?, ¿ha consultado usted a su médico por esta causa?, ¿le produce alteraciones en su vida cotidiana?, en relación con su memoria, ¿se encuentra usted peor que otras personas de su misma edad?28. Se preguntó: ¿con qué frecuencia usted se ha sentido solo/a durante el último año?, que se respondía en una escala Likert de 4 opciones (siempre o casi siempre, bastantes veces, pocas veces y nunca o casi nunca).
Procedimiento
Los datos de este estudio proceden del Estudio de Salud de la ciudad de Madrid 201829. El universo poblacional lo compusieron las personas residentes en la ciudad de Madrid de 15 y más años de edad. Se realizaron 9.676 entrevistas telefónicas, de las que 8.845 pudieron completarse y se consideraron válidas, asegurándose además un mínimo de 400 entrevistas por distrito.
El tipo de muestreo utilizado fue el aleatorio estratificado bietápico. El criterio de estratificación fue el distrito de la ciudad y en cada uno se realizó postestratificación por sexo y grupos de edad a partir de tamaños mínimos prefijados. La selección de las unidades muestrales de primera etapa (hogares) se hizo por muestreo aleatorio simple en cada estrato geográfico y la de segunda etapa (las personas a entrevistar) también mediante un sistema aleatorio simple dentro de cada hogar, hasta completar las comentadas cuotas prefijadas por edad y sexo según la composición poblacional de cada estrato. En cada hogar se realizó solo una entrevista. De entre toda la muestra, el análisis que aquí se presenta se realizó solo sobre los encuestados de más de 65 años.
La recogida de información fue mediante entrevista telefónica cumplimentada por encuestadores formados previamente y asistida por ordenador mediante la técnica CATI30 a partir de un cuestionario estructurado. El trabajo de campo se realizó entre octubre y diciembre de 2017.
El nivel relativo de desarrollo de los distritos se obtuvo mediante el cálculo del Índice Combinado de Salud, Conocimiento y Renta (ICSCR), un índice desarrollado por este equipo de trabajo y sobre el que acumula amplia experiencia31. El ICSCR se obtiene con la misma metodología y a partir de información de las mismas áreas que el elaborado por el Programa de las Naciones Unidas para el Desarrollo (PNUD), el conocido IDH. Una vez obtenido para cada distrito se efectuó un análisis de conglomerados que los agrupó en 4 categorías, que fueron denominadas: de alto desarrollo, de desarrollo medio alto, de desarrollo medio bajo y de bajo desarrollo.
Para la caracterización según clase social se clasificó a los encuestados por su clase ocupacional, siguiendo las recomendaciones de la Sociedad Española de Epidemiología32. Se asignó a cada entrevistado la clase social del hogar en que está incluido, que no es necesariamente la de la persona que contesta al cuestionario, sino la de la persona sustentadora principal de ese hogar.
Previamente a la recogida de datos, se informó a los participantes del objetivo de la prueba y se solicitó su conformidad para continuar. El estudio fue aprobado por el Comité de Ética del Instituto de Salud Carlos III de Madrid (n.º CEI PI 51_2017-v2).
Análisis de datos
Se efectuó un estudio psicométrico a nivel del ítem y de la escala. Se aplicó el criterio de Mardia para comprobar si los datos se ajustaban a una distribución normal multivariada. Se estudió la correlación ítem-test, una vez excluido el propio ítem. Se efectuó un análisis paralelo optimizado para conocer el número de dimensiones que deberían retenerse y se aplicaron indicadores de ajuste para conocer el ajuste a los datos de la solución obtenida (CFI, NNFI, GFI, AGFI y RMSEA). Se aplicaron también estimadores de calidad y efectividad de la solución factorial (FDI, EPTD) y de replicabilidad del constructo33. Se estudió la consistencia interna mediante 3 estimadores adecuados al tipo de respuestas y la distribución de los ítems: GLB, omega de McDonald (ω) y alfa de Cronbach estandarizada (αs), informando de todos ellos, como se recomienda actualmente34,35. Las diferencias de medias se exploraron mediante análisis de covarianza, utilizando la omega al cuadrado (ω2) como estimador del tamaño del efecto. Para las comparaciones entre categorías se utilizó la V de Cramer como estimación del tamaño del efecto. Se obtuvieron correlaciones mediante el coeficiente de Pearson. Para la interpretación del tamaño del efecto se utilizaron las reglas a ojo de buen cubero (rules of thumb) propuestas por Cohen36. Se realizó un análisis de regresión del resto de variables sobre la prueba principal, utilizando la R2 para estudiar la proporción de la varianza explicada y la β como estimador del tamaño del efecto. Para todos estos análisis se utilizaron el programa FACTOR 10.09.0237 y el paquete estadístico SPSS 17 (la omega al cuadrado se calculó manualmente a partir de la tabla del ANOVA).
RESULTADOS
En la tabla 2 se muestran los descriptivos de los ítems. Mediante inspección visual puede comprobarse que varios ítems presentan valores elevados de asimetría y curtosis, confirmando, mediante la prueba de Mardia, que los datos no se ajustan a una distribución normal multivariada (p < 0,001).
A la vista de estos resultados, se configuró la matriz de correlaciones tetracóricas. Los datos obtenidos permitían la aplicación de un método factorial (Bartlett = 1.270,3; p < 0,001; KMO = 0,71). Se efectuó un análisis paralelo optimizado, que ofreció una inequívoca solución unifactorial que explicaba el 45,3% de la varianza total del test. Esta solución unifactorial obtuvo adecuados indicadores de ajuste (CFI = 0,97; NNFI = 0,96; GFI = 0,97; AGFI = 0,97; RMSEA = 0,07), de calidad y efectividad (FDI = 0,95; EPDT = 92,9%), y de replicabilidad (H-latente = 0,91; H-observada = 0,45), mostrando también adecuadas evidencias de fiabilidad (GLB = 0,85; ω = 0,75; αs = 0,76).
Aplicando los criterios habituales de la prueba, un 58,1% de la muestra (intervalo de confianza del 95%, 55,9-60,3) estaría en riesgo de dependencia funcional (varones 46,8%, mujeres 65,3%; χ2 = 63,0; p < 0,001; V = 0,18). Los ítems que justifican la clasificación en riesgo de dependencia varían significativamente entre hombres y mujeres: las mujeres viven solas con más frecuencia, requieren de ayuda de otros, se ven más frecuentemente imposibilitadas de salir a la calle y, con más frecuencia, tienen problemas de salud que les impiden valerse por sí mismas (tabla 3).
En la tabla 4 se muestran las diferencias observadas según variables sociodemográficas, y en la tabla 5 se observa la correlación con otras variables de salud. La puntuación total del test correlacionó significativa y positivamente con la edad (r = 0,28; p < 0,001).
El modelo de regresión, obtenido a partir de las variables sociodemográficas y de salud sobre la puntuación del Barber, encuentra que las variables con mayor capacidad predictiva son la CVRS (R2 = 0,18; β = 0,17), el sentimiento de soledad (R2 = 0,07; β = 0,23) y la edad (R2 = 0,04; β = 0,21).
DISCUSIÓN
El cuestionario de Barber es uno de los más utilizados en la clínica para detectar a personas mayores en riesgo de dependencia funcional. Sin embargo, no se dispone de datos sobre su posible utilidad en estudios epidemiológicos. El objetivo principal de este trabajo es estudiar ciertas propiedades psicométricas de la prueba, en concreto su fiabilidad, su validez estructural y su validez convergente con pruebas relacionadas. Para ello, se estudió una muestra amplia de sujetos mayores de 65 años, representativa de una gran ciudad española (Madrid). El cuestionario de Barber resultó ser una prueba unidimensional, con adecuada fiabilidad, con buenos indicadores de ajuste y potencialmente replicable en otros estudios. Su consistencia interna también alcanzó valores aceptables.
Habitualmente se considera que basta una sola pregunta respondida afirmativamente para clasificar a la persona en situación de riesgo de dependencia funcional. Según este criterio, un 58,6% de la muestra sería población de riesgo, lo que trasladado a la población de referencia significaría que entre el 56,4 y el 60,8% de las personas de más de 65 años tendrían comprometida su independencia funcional. No se han encontrado estudios previos con los que pueda compararse este resultado.
Las mujeres obtienen puntuaciones significativamente mayores que los hombres, de modo que el perfil tipo de riesgo de dependencia funcional se correspondería con el de una mujer, de clase social desfavorecida, con estudios primarios y residente en un distrito de bajo desarrollo. No es posible comparar estos resultados con los de estudios previos, pues todos los disponibles se refieren a muestras clínicas o de voluntarios. Además, aunque es frecuente que las mujeres puntúen más que los hombres, son esperables grandes diferencias entre poblaciones, justificadas por los diferentes contextos: rural frente a urbano, países más o menos desarrollados, etc. En todo caso, estos resultados son coherentes con lo obtenido en estudios previos, en los que se encuentra que los varones tienen menos esperanza de vida, pero más esperanza de vida en buena salud38.
Las puntuaciones en el Barber correlacionan significativamente con los indicadores de salud: a mayor puntuación de riesgo peor salud percibida, mayores problemas de salud mental, más quejas de memoria, mayor sensación de soledad y menor calidad de vida percibida. Estas dos últimas son las que correlacionan con mayor magnitud del efecto y las que obtienen una mayor capacidad predictiva en el análisis de regresión lineal, junto con la edad.
Las limitaciones del presente estudio tienen que ver principalmente con el método de obtención de la información. Son conocidos los sesgos potenciales de las encuestas de salud, tanto referidos al uso de cuestionarios, como al carácter telefónico de la entrevista39 o a los sesgos introducidos por los participantes, como el sesgo de deseabilidad. No obstante, el diseño muestral permite asumir que todos estos problemas se han podido minimizar.
CONCLUSIONES
El cuestionario de Barber presenta adecuadas propiedades psicométricas cuando se aplica en el contexto de una encuesta poblacional y permite detectar a segmentos de población con riesgo de desarrollar una dependencia funcional. A tenor de los resultados de este estudio, más de la mitad de la población urbana mayor de 65 años tiene riesgo potencial de perder su independencia funcional, y se requieren evaluaciones más personalizadas para aquilatar tal riesgo. Conocer la magnitud del problema y su evolución temporal permite visibilizar el problema y diseñar programas preventivos, de apoyo o paliativos que aborden este problema de forma eficaz.