Introducción
El proceso de envejecimiento suele estar asociado a un deterioro en la capacidad funcional, que en muchas ocasiones puede producir problemas en la realización de las actividades cotidianas y conducir a una situación de dependencia en la que se requiere la ayuda de otra persona para desempeñarlas. El desarrollo de medidas de valoración es fundamental en la asistencia geriátrica y en la organización de los cuidados de larga duración1-2. La capacidad funcional puede medirse a través de la combinación de actividades de la vida diaria (ítems), básicas (AVD) e instrumentales (AIVD)3. Para ello suelen utilizarse diversos métodos de escalamiento, desde los más sencillos con la aplicación de la teoría clásica de los test (suma de varios ítems o de sus categorías) hasta los más complejos como los métodos Guttman o Rasch.
Uno de los métodos más sencillos consiste en obtener la puntuación de un individuo mediante la suma algebraica de sus respuestas sobre desempeño de las actividades cotidianas; sin embargo, una desventaja es que para poder puntuar a un individuo es necesario conocer sus respuestas a todos los ítems. Los métodos Guttman y Rasch, aparte de ofrecer una puntuación, tienen la ventaja de ordenar ítems y personas con respecto a una dimensión acumulativa subyacente4-6. El método Guttman tiene la ventaja de ser relativamente fácil de llevar a cabo, pues no se necesita conocer las respuestas a todos los ítems para asignar una puntuación; sin embargo, es determinista, pues asume que la probabilidad de respuesta favorable a un ítem es 0 o 1, es decir, no toma un valor continuo entre esos valores. El modelo Rasch supera la rigidez de Guttman, tiene la ventaja de ser robusto a valores perdidos y permite obtener una escala lineal de intervalo5-6, pero tiene el inconveniente de su mayor complejidad y tiempo para su desarrollo en comparación con los otros dos métodos. Además de considerar las ventajas y los inconvenientes de los citados métodos, sus cualidades psicométricas nos darían también un criterio para elegir entre ellos.
Por todo lo anterior, el objetivo de este estudio fue comparar estos métodos de escalamiento de actividades de la vida diaria de personas mayores, analizar sus propiedades psicométricas y comprobar si los más complejos proporcionan una mayor capacidad discriminatoria.
Método
Participantes
Los datos proceden de la Encuesta sobre discapacidad, autonomía personal y situaciones de dependencia, realizada por el Instituto Nacional de Estadística7. El análisis se realizó con las respuestas de personas de 65 y más años; cuando no pudieron contestar, se utilizó la respuesta de un proxy.
Instrumentos
Se tuvieron en cuenta 14 ítems sobre AVD y AIVD que demostraron buenas propiedades psicométricas en un estudio anterior8: levantarse/acostarse, mantener la postura corporal, andar o moverse dentro la vivienda, andar o moverse fuera de la vivienda, desplazarse en medios de transporte, lavarse/ducharse, peinarse/cortarse las uñas, control de la necesidad de orinar, control de la necesidad de defecar, vestirse, comer, hacer la compra, preparar la comida y realizar las tareas de casa. Se preguntó si tenía dificultad para realizar cada una de estas actividades (forma dicotómica: 0, no discapacidad; 1, discapacidad), y además sobre el nivel de esa dificultad (forma politómica: 0, no discapacidad; 1, moderado; 2, importante; 3, no poder realizar la actividad). Se excluyeron los individuos que no indicaron el nivel de dificultad y aquellos con dificultad para otra actividad no seleccionada.
Por último, se recogieron datos de una variable específica de control: «¿se ha visto limitado para realizar las actividades que la gente habitualmente hace, debido a un problema de salud o discapacidad?». Las opciones de respuesta fueron: gravemente limitado, limitado pero no gravemente, y no limitado.
Análisis estadístico
Se desarrollaron cinco métodos de escalamiento: Guttman, Suma y Rasch; se utilizaron ítems en forma dicotómica y los dos últimos también en forma politómica. Se analizaron sus propiedades psicométricas. Se comprobó la unidimensionalidad del conjunto de ítems, es decir, si todos medían el mismo constructo de discapacidad, mediante análisis factorial exploratorio a partir de la matriz de correlaciones tetracóricas para ítems dicotómicos y de correlaciones policóricas para ítems politómicos. El número de factores se determinó según el número de autovalores mayores que 1 y el porcentaje de varianza explicada por el factor9. Posteriormente se estudió la consistencia interna calculando el coeficiente 20 Kuder-Richardson (KR20, ítems dicotómicos) y el alfa de Cronbach (ítems politómicos). Los valores por encima de 0,9 muestran una consistencia interna excelente10.
1) Método Rasch
En el análisis para ítems politómicos se utilizó el modelo de crédito parcial11. Tanto para los ítems en forma dicotómica como politómica se evaluaron las propiedades del modelo y se hicieron modificaciones iterativamente hasta llegar al modelo final. La primera propiedad evaluada es el ajuste de los datos. Se consideró que hay buen ajuste cuando la probabilidad del estadístico ji cuadrado, con corrección de Bonferroni por número de ítems, era no significativa. Además, los valores de los estadísticos de los residuos, tanto de los ítems como de las personas, no deberían exceder los valores ± 2,512. Para evitar un ajuste condicionado por un conjunto de datos excesivamente grande se seleccionó una muestra aleatoria de 250 personas13. Si los umbrales de los ítems no seguían una secuencia ordenada, las categorías de respuesta adyacentes fueron agrupadas6. La fiabilidad se evaluó a través del Person Separation Index (PSI), considerando como bueno un valor >0,7012.
Una correlación de residuos >0,30 significa que los ítems tienen dependencia local. Una manera de solucionar este problema es juntar los ítems causantes de esa dependencia en superítems14. Por ejemplo, si se juntan dos ítems (en forma dicotómica) en un superítem, la suma de la respuesta de no discapacidad (valor = 0) o discapacidad (valor = 1) da lugar a tres categorías del nuevo superítem: no discapacidad en ninguno de los dos ítems (valor = 0), discapacidad en uno solo (valor = 1) o discapacidad en los dos (valor = 2). En el caso de un superítem formado con tres ítems daría lugar a cuatro categorías: no discapacidad en ninguno de los tres (valor = 0), discapacidad en uno solo (valor = 1), en dos (valor = 2) o en los tres (valor = 3). Si en la forma politómica se construye un superítem se procede de la misma manera, pero en este caso se suman los valores de las diferentes respuestas sobre el nivel de dificultad; así, si una persona tiene dificultad moderada (valor = 1) en un ítem y dificultad importante (valor = 2) en el otro, el superítem formado por los dos ítems sencillos tendría como puntuación 3. Obviamente, con este procedimiento se pueden alcanzar muchas más categorías.
El método Rasch debe cumplir la propiedad de unidimensionalidad, medida con un análisis de componentes principales de residuos, separando los ítems en dos conjuntos según su carga factorial (valor positivo y negativo). La diferencia en las estimaciones para cada persona en estos dos conjuntos se analizó mediante un test T independiente, suponiendo que la escala era unidimensional si menos del 5% de los test T se encontraban fuera del intervalo de −1,96 a 1,96. Otro criterio para probar la unidimensionalidad fue que, para el número observado de test significativos, el intervalo de confianza (IC) de la binomial al 95% debería superponerse al valor esperado del 5%12.
Finalmente, con las puntuaciones Rasch se obtuvo una medida lineal de intervalo (escala logit), en la que los valores negativos denotan mayor habilidad en la realización de actividades de la vida diaria y los positivos significan mayor discapacidad.
2) Método Guttman
Los ítems fueron escalados según el procedimiento Guttman de menor a mayor problema para realizar la actividad, asignando valores correlativos desde 1 tras el ordenamiento de los ítems15. La escala Guttman no utiliza respuestas politómicas, sino dicotómicas; en caso de existencia de superítems, estos se dicotomizaron, considerando valor 0 (sin discapacidad) y valor 1 (discapacidad en el resto de categorías). Se calcularon los índices de reproducibilidad y escalabilidad que indican la capacidad/validez para reproducir las respuestas de los individuos a partir de su puntuación total y conformar una escala acumulativa; son aceptables índices por encima de 0,9 y 0,6, respectivamente16.
3) Método Suma
Se asignó a cada individuo una puntuación igual a la suma de sus respuestas a cada ítem tanto en la versión del método en forma dicotómica (rango de puntuaciones: 0-14) como en la politómica (rango de puntuaciones: 0-42).
4) Comparación de métodos
Se transformaron todas las puntuaciones de los cinco métodos en escalas lineales de 0-100 para hacerlas comparables entre sí; de este modo, una mayor puntuación indica una mayor discapacidad. Se calcularon correlaciones de Pearson entre escalas para estudiar su intensidad de relación, siendo alta con correlaciones por encima de 0,717. Además, se realizaron diferentes pruebas no paramétricas de Mann-Whitney para comparar los rangos de puntuaciones medias respecto de las categorías de la variable específica de control. A continuación, con los valores Z resultantes de cada una de estas pruebas se calcularon los correspondientes valores de precisión relativa (PR), tomando como referencia la escala Rasch de ítems politómicos18; el valor de PR se obtiene para cada par de escalamientos y cada par de categorías de la variable específica de control, como el cociente de los respectivos valores Z obtenidos en las pruebas no paramétricas. Estos valores de PR informaron sobre cuánto más preciso es el escalamiento de referencia respecto a cada uno de los otros escalamientos. Además, se calculó el tamaño del efecto asociado al valor Z, que puede ser pequeño (alrededor de 0,1), mediano (alrededor de 0,3) y grande (alrededor de 0,5)19.
Por último, para saber en qué medida las diferentes escalas discriminarían bien a una persona mayor gravemente limitada de una con limitación pero no grave o sin limitación, se realizó una prueba diagnóstica de cada escalamiento mediante el uso de curvas ROC (receiver operating characteristics). Estas curvas comparan la probabilidad de clasificar correctamente a un individuo gravemente limitado (sensibilidad de la prueba) con la probabilidad de clasificar como gravemente limitado a un individuo que no lo es (1 − especificidad). El análisis Rasch se realizó con el programa RUMM203020, y el resto de los análisis con SPSS versión 22 y Stata 12.0.
Resultados
El tamaño final efectivo de la muestra fue de 39.430 personas, de las que el 55,9% eran mujeres. Las distribuciones porcentuales de las personas encuestadas según categorías de los ítems se recogen en la Tabla 1. El análisis factorial exploratorio indicó la existencia de un único factor, tanto en el conjunto de ítems dicotómicos (autovalor igual a 7,05 con una variabilidad total explicada del 95,24%) como en el de ítems politómicos (6,96% y 96,74%, respectivamente). Las cargas factoriales presentaron un rango de 0,671 a 0,877 en el análisis de ítems dicotómicos y un rango de 0,666 a 0,902 para ítems politómicos. Además, se obtuvo un coeficiente KR20 igual a 0,91 (ítems dicotómicos) y un alfa de Cronbach de 0,92 (ítems politómicos).
Categorías de respuesta | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |
Forma dicotómica (tener o no tener discapacidad) | ||||||||||
Levantarse + mantenerse | 89,7 | 3,3 | 6,9 | |||||||
Andar dentro | 91,4 | 8,6 | ||||||||
Andar fuera + autobús | 84,6 | 3,1 | 12,4 | |||||||
Lavarse + peinarse | 86,2 | 3,7 | 10,0 | |||||||
Orinar + defecar | 92,3 | 2,6 | 5,1 | |||||||
Vestirse | 90,6 | 9,4 | ||||||||
Comer | 96,1 | 3,9 | ||||||||
Compra + comida + tareas casa | 83,4 | 3,1 | 3,3 | 10,3 | ||||||
Forma politómica (puntuación según nivel de dificultad) | ||||||||||
Levantarse + mantenerse | 89,7 | 1,4 | 2,5 | 1,3 | 2,4 | 0,8 | 1,8 | |||
Andar dentro | 91,4 | 2,1 | 3,5 | 3,0 | ||||||
Andar fuera + autobús | 84,6 | 1,1 | 2,4 | 1,6 | 3,4 | 1,9 | 4,9 | |||
Lavarse + peinarse | 86,2 | 1,3 | 2,3 | 1,8 | 2,5 | 1,1 | 4,8 | |||
Orinar + defecar | 92,3 | 1,3 | 1,5 | 0,7 | 1,3 | 0,4 | 2,5 | |||
Vestirse | 90,6 | 2,1 | 2,9 | 4,4 | ||||||
Comer | 96,1 | 1,0 | 1,4 | 1,5 | ||||||
Compra + comida + tareas | 83,4 | 0,8 | 1,5 | 1,9 | 1,0 | 0,9 | 2,1 | 0,6 | 0,7 | 7,3 |
El signo + indica la presencia de un superítem formado por dos o tres ítems sencillos. En la forma dicotómica se suman las dos posibles categorías de los ítems sencillos (tener o no tener discapacidad). En la forma politómica se suman las tres posibles categorías (con dificultad moderada, con dificultad importante, no poder realizar la actividad).
En los primeros análisis Rasch con 14 ítems se observaron problemas de dependencia local. La reducción por adición de los ítems dio lugar a una lista final de ocho ítems, tres sencillos (andar dentro, vestirse, comer) y cinco superítems (levantarse+mantenerse, andar fuera+autobús, lavarse+peinarse, orinar+defecar, compra+comida + tareas). Estos ocho elementos definitivos fueron los utilizados también para los métodos Guttman y Suma, con el fin de comparar escalas con el mismo número de elementos.
El modelo Rasch final presentó buen ajuste de los datos al modelo (χ2(40) = 54,954; p = 0,058), con un valor medio en los estadísticos de ajuste de los residuos de −0,424 (desviación típica [DT] = 0,882) para los ítems y de −0,265 (DT = 0,619) para las personas. Ningún estadístico de los residuos para ítems y personas de manera individual excedía de los valores ± 2,5. Se obtuvo un valor de PSI de 0,762. El análisis final no mostró problemas de dependencia local entre ítems, y se confirmó la unidimensionalidad de la escala (3,20% de valores extremos, IC binomial 95% = 0,005; p = 0,059). En el caso de los ítems politómicos se observó un buen ajuste (χ2(32) = 39,343; p = 0,174), con un valor medio de −0,175 (DT = 0,993) para los ítems y de −0,248 (DT = 0,726) para las personas. Los residuos para ítems y personas de manera individual se encontraron dentro de los valores ± 2,5, con una buena fiabilidad (PSI = 0,877). Se confirmaron la independencia local entre ítems (correlaciones <0,3) y la unidimensionalidad de la escala (4% de valores extremos; IC binomial 95% = 0,013; p = 0,067).
En el procedimiento de escalamiento Guttman, el coeficiente de reproducibilidad fue de 0,96 y el de escalabilidad fue de 0,87, por encima de los umbrales aceptables. El orden de los ítems de menor a mayor carga de discapacidad según los diferentes métodos de escalamiento se presenta en la Tabla 2.
Rasch dicotómico | Rasch politómico | Guttman |
---|---|---|
Andar fuera + autobús | Compra + comida + tareas casa | Lavarse + peinarse |
Compra + comida + tareas casa | Andar fuera + autobús | Compra + comida + tareas casa |
Lavarse + peinarse | Lavarse + peinarse | Andar fuera + autobús |
Vestirse | Vestirse | Vestirse |
Levantarse + mantenerse | Orinar + defecar | Levantarse + mantenerse |
Andar dentro | Levantarse + mantenerse | Andar dentro |
Orinar + defecar | Andar dentro | Orinar + defecar |
Comer | Comer | Comer |
Los cinco escalamientos tuvieron coeficientes altos de correlación (Tabla 3), aunque más bajos en el método Guttman. Las correlaciones entre los métodos Suma y Rasch fueron las más altas.
Rasch dicotómico | Rasch politómico | Guttman | Suma dicotómico | Suma politómico | |
---|---|---|---|---|---|
Media | 9,0 | 7,4 | 5,4 | 10,3 | 8,0 |
Desviación típica | 22,0 | 17,9 | 17,7 | 24,9 | 20,8 |
Correlaciones | |||||
Rasch politómico | 0,979 | ||||
Guttman | 0,800 | 0,765 | |||
Suma dicotómico | 0,993 | 0,968 | 0,805 | ||
Suma politómico | 0,979 | 0,984 | 0,789 | 0,976 |
Todas las correlaciones son significativas con un valor 0,01.
La Tabla 4 muestra los estadísticos del test de diferencias de Mann Whitney y la precisión relativa. Todos los métodos de escalamiento mostraron similar poder discriminatorio en la variable específica de control al comparar categorías extremas de individuos, aunque no en las intermedias, en las que el método Guttman resultó ser menos preciso que el Rasch politómico. Para el resto de los procedimientos se obtuvieron PR muy cercanas o iguales a 1; los procedimientos Suma y Rasch dicotómico presentaron similar o igual poder discriminatorio que el Rasch politómico. Los tamaños del efecto asociado a los valores Z fueron grandes (alrededor y por encima de 0,5).
Valores Z test Mann Whitney (tamaño del efecto) | Precisión relativa (ratio de valores Z) Base: escala Rasch | |||||
---|---|---|---|---|---|---|
Escala | No limitado vs. no gravemente | No limitado vs. gravemente | No gravemente vs. gravemente | No limitado vs. no gravemente | No limitado vs. gravemente | No gravemente vs. gravemente |
Rasch politómico | 105,77 (0,56) | 153,31 (0,84) | 58,64 (0,59) | 1,000 | 1,000 | 1,000 |
Rasch dicotómico | 105,86 (0,56) | 153,28 (0,84) | 57,89 (0,59 | 1,001 | 1,000 | 0,987 |
Guttman | 80,27 (0,43) | 142,60 (0,78) | 45,22 (0,46) | 0,759 | 0,930 | 0,771 |
Suma dicotómica | 105,86 (0,56) | 153,28 (0,84) | 57,89 (0,59) | 1,001 | 1,000 | 0,987 |
Suma politómica | 105,75 (0,56) | 153,35 (0,84) | 59,12 (0,60) | 1,000 | 1,000 | 1,008 |
El método Suma politómico es el que mostró una mayor área bajo la curva ROC (Fig. 1). Así, la probabilidad de que una persona gravemente limitada puntúe más alto que una no gravemente limitada es de 0,934. Se observó que los intervalos de confianza asintóticos de los procedimientos Rasch y Suma (ítems politómicos y dicotómicos) se solapaban. El método de escalamiento Guttman resultó el menos discriminante (área bajo la curva = 0,853); además, su intervalo de confianza no se solapó con el del resto de los métodos.
Discusión
Este estudio tuvo como objetivo comparar las propiedades psicométricas de cinco métodos de escalamiento que combinan actividades de la vida diaria. Primero se comprobó que los ítems de AVD y AIVD forman un único constructo unidimensional y muestran una buena consistencia interna. Por tanto, estos ítems son adecuados para la aplicación de métodos de escalamiento para medir la discapacidad en las personas mayores. Los cinco métodos utilizados presentaron buenas propiedades psicométricas.
Los índices de consistencia interna mostraron unos valores mínimos comúnmente aceptados, y adecuados para comparaciones individuales21. El método Rasch politómico presentó una mayor fiabilidad que el de ítems dicotómicos, lo que significa que es apropiado para la comparación entre individuos, mientras que la escala de ítems dicotómicos solo puede ser comparada entre grupos de población (PSI >0,70)12.
Existen diferencias importantes en el grado de complejidad de los métodos, que pueden ordenarse del más complejo al más simple: Rasch (en forma politómica y dicotómica), Guttman y finalmente Suma (en ambas formas). En términos de poder discriminante, los cinco son similares para diferenciar las personas gravemente limitadas de las no limitadas (casos extremos). Si se pretende discriminar entre otras categorías de limitación (no limitados frente a no gravemente limitados; gravemente limitados frente a no gravemente limitados), son más convenientes los procedimientos Rasch y Suma que el Guttman. En consecuencia, los investigadores y los clínicos que traten con personas mayores sin discapacidad o con discapacidad leve o moderada pueden considerar los métodos Rasch y Suma como opciones igualmente válidas en esos casos. Si no se dispone de capacidad computacional, se propone utilizar el método Suma por ser menos complejo en términos de análisis y tiempo de ejecución.
Nuestro estudio sugiere que el método Guttman presenta peores resultados en cuanto a poder discriminante. Esto difiere de los resultados encontrados en otro estudio que no muestra diferencias entre los procedimientos22, pero en él solo se utilizaron AIVD y en el nuestro se incluyeron también AVD, lo que nos permite colocar a todos los ítems en un continuo más amplio23. En otro estudio se señala que los instrumentos de medida que incluyen AVD y AIVD son adecuados, y que una medida de solo AVD es sesgada y no adecuada para comparar la discapacidad24. Por ello, se recomienda utilizar las AVD y las AIVD para la evaluación geriátrica8 25 26.
Los métodos Rasch y Guttman permitieron ordenar las actividades en una jerarquía de discapacidad, según el grado de habilidad o capacidad del individuo para ejecutarlas. Aunque hay diferencias, los procedimientos mostraron una ordenación lógica y similar. Los problemas de discapacidad suelen comenzar en las actividades instrumentales, más complejas y que requieren un mayor esfuerzo y habilidad para su ejecución, y mayor conocimiento para toma de decisiones, pero son de carga de cuidado más leve (p. ej., comprar o realizar tareas domésticas); suelen terminar en aquellas actividades básicas más sencillas de ejecutar (p. ej., lavarse, comer), pero que implican mayor carga de cuidado8 27 28.
Las curvas ROC y la precisión relativa mostraron diferencias importantes entre el método Guttman y los otros. Nuestro estudio sugiere también que estrategias complejas de escalamiento, como Rasch, proporcionan igual validez discriminativa del grado de discapacidad de las personas mayores que los métodos más sencillos, por ejemplo Suma, aunque otros estudios apoyan las ventajas del modelo Rasch29.
Deben tenerse en consideración varias limitaciones. Las estrategias de escalamiento utilizadas son quizás las más comunes, pero no las más exhaustivas30. Además, las razones de fondo por las que los métodos más complejos no producen puntuaciones sustancialmente más válidas ni discriminantes no han sido estudiadas. Otra limitación es que individuos con diferentes combinaciones de ítems pueden llegar a puntuar igual.
Una fortaleza del estudio es la comparación de medidas de asistencia geriátrica que combinan AVD y AIVD en una muestra de personas mayores representativa del ámbito nacional.
Por último, las principales conclusiones son:
El hallazgo más relevante es que la complejidad en los procedimientos no aporta mayor poder discriminante para evaluar el grado de discapacidad en las personas mayores.
Se recomienda la utilización de ítems politómicos que midan el nivel de dificultad de las actividades de la vida diaria.
En la práctica clínica, si se prefieren métodos más sencillos, se puede recurrir al Suma.
Nuestros resultados no apoyan la utilización del método Guttman frente al resto de los procedimientos.
¿Qué se sabe sobre el tema?
El desarrollo de medidas de valoración de la capacidad funcional es fundamental y está muy extendido en la asistencia geriátrica y en la organización de los cuidados de larga duración. Existen diversos métodos de escalamiento, desde los más simples hasta los más complejos, y se han utilizado en muestras de población variadas. El tipo de escalamiento influye en cómo recoger los resultados en la evaluación sobre la discapacidad.
¿Qué añade el estudio realizado a la literatura?
Nuestro estudio encuentra que métodos sencillos de escalamiento proveen similar poder discriminante que los complejos para evaluar el grado de discapacidad en las personas mayores. La utilización de herramientas más simples que requieran menos tiempo tiene implicación en la práctica clínica. Se utiliza una muestra representativa nacional.