INTRODUCCIÓN
En España, las desigualdades en el ámbito social o económico entre las Comunidades Autónomas así como la aplicación de distintas políticas en salud u otros ámbitos, pueden haber contribuido a una cierta variabilidad geográfica en las consecuencias de la reciente crisis sobre la salud y las desigualdades en salud1,2. Bajo esa hipótesis se creó el Subprograma de Investigación en Crisis y Salud del CIBER de Epidemiología y Salud Pública (CIBERESP). Este Subprograma utiliza como fuentes principales de información las ediciones 2006/07 y 2011/12 de la Encuesta Nacional de Salud de España (ENSE)3, así como indicadores de contexto sobre Determinantes Sociales de Salud2.
La ENSE recoge información transversal sobre estilos de vida, estado de salud, morbilidad y utilización de servicios sanitarios de la población general española. Es una de las fuentes más relevantes para el estudio de determinantes sociales de la salud (DSS)4 que, además, permite estudiar el impacto de la recesión económica en la salud mediante la comparación de sus ediciones 2006/07 y 2011/12. Esta comparación se ha realizado parcialmente, es decir, sobre variables y muestras específicas según los objetivos de cada estudio5,6,7, y sin ofrecer una descripción detallada del proceso seguido, de las incidencias detectadas ni sus consecuencias sobre las bases de datos fusionadas.
Esa necesidad de realizar y valorar la comparabilidad completa de ambas ediciones de la ENSE es el objetivo de este trabajo. Para ello, describimos el procedimiento llevado a cabo para la fusión e incidencias detectadas tanto de las bases de datos de adultos como de las de menores de ambas ediciones de la ENSE. Además, proporcionamos acceso libre a las bases de datos fusionadas y al directorio y diccionarios de variables creados.
MATERIAL Y MÉTODOS
Partiendo de los correspondientes cuestionarios de personas adultas, menores y hogares de ambas ediciones de la ENSE, se identificaron aquellas variables que podrían ser comparables para su fusión (figura 1). Posteriormente, cuando fue necesario, se construyeron nuevas variables a partir de las originales con el fin de hacerlas comparables o para proporcionar nuevos indicadores de interés. En algunos casos, por resultar más eficiente, el tratamiento de las variables para su fusión se realizó directamente en la base de datos de una edición concreta.
En la fusión de las bases de datos de las ENSE 2006/07 y 2011/12 codificamos las incidencias como sigue:
Definición o enunciado de variables diferente.
Categorización diferente.
Incompatibilidad de nivel de medida utilizado.
Variables no disponibles entre ediciones.
Referencias temporales diferentes.
Finalmente, se obtuvo la base de datos fusionada, una para adultos (que incluye las variables de la base de hogares) y otra para menores, así como un directorio y diccionario de variables para cada una. El software utilizado fue R8 y el paquete auxiliar sqldf para consultas SQL de bases de datos de R9.
RESULTADOS
Se identificaron 13 ámbitos temáticos así como 123 y 65 variables potencialmente comparables a partir de los cuestionarios de adultos y menores, respectivamente, de ambas ediciones de la ENSE (2006/07 y 2011/12, tabla 1). En un 36,7% de ellas hubo algún problema para su comparabilidad entre ambas ediciones, y un 8% tuvieron que ser eliminadas porque no estaban incluidas en la edición de 2006/07 o en la de 2011/12.
Así pues, un 11,4% del total de variables identificadas en la muestra de adultos (14 variables), no pudieron fusionarse porque no estaban definidas en la edición de 2006/07 (6 variables) o en la de 2011/12 (8 variables), mientras que en la muestra de menores solo una variable tuvo que excluirse (no existía en 2006/07).
Por otro lado, un 34,1% de las variables identificadas en la muestra de adultos tuvieron que ser tratadas para hacer posible su fusión, resultando ser un 26% en ambas ENSE (32 variables), un 6,5% solo en la de 2006/07 y un 1,6% solo en la de 2011/12 (8 y 2 variables, respectivamente).
En definitiva, el 54,5% de las variables identificadas en la muestra de adultos y el 92,3% de la de menores se pudieron fusionar directamente, sin necesidad de realizar ningún tratamiento para su correcta comparabilidad entre ambas ediciones de la ENSE (67 y 60 variables, respectivamente). Por otra parte, a partir de las variables originales de ambas ediciones, se crearon 32 nuevas variables en la base de datos de adultos y 2 en la de menores.
Según ámbitos temáticos, en la muestra de adultos, las variables relacionadas con cuidados fueron las más problemáticas aunque, afortunadamente, conseguimos no tener que eliminar ninguna (tabla 1). Por otra parte, el ámbito con peores consecuencias de la falta de comparabilidad fue el de condiciones de trabajo y empleo, donde tuvimos que excluir casi la mitad de sus variables. Con respecto a la muestra de menores, los ámbitos con mayores problemas fueron los de características sociodemográficas y acceso y utilización de servicios de salud (57,1% y 56,5%, respectivamente), aunque finalmente conseguimos mantener todas sus variables.
Otros problemas sistemáticos que identificamos estuvieron relacionados con las respuestas ‘no sabe’ o ‘no contestan’, que sólo existen para 2011/12 en la mayoría de las variables, mientras que para 2006/07 el registro se limita a contemplar la opción ‘no consta’. Esta distinción es fundamental a la hora de evaluar la calidad de las preguntas, dado que no miden la misma naturaleza de falta de respuesta. Por otra parte, mientras que en 2006/07 la edad mínima en la muestra de adultos es de 16 años, en 2011/12 es de 15. Esta diferencia, a pesar de ser fácilmente subsanable en la encuesta de adultos (eliminando las personas de 15 años) y tener consecuencias poco relevantes en esa muestra (sólo el 0,59% de la muestra obtenida en 2011/12 tenía 15 años de edad), sí que puede tener consecuencias importantes en la muestra de menores, ya que las personas de 15 años suponen un 7,3% del total de la muestra de menores en la edición de 2006/07.
Los directorios de variables de las muestras de adultos y de menores incluyen información detallada de las características, incidencias, acciones y decisiones adoptadas para cada una de las variables de ambas ediciones de la ENSE (extracto en tabla 2), así como un diccionario con los códigos y etiquetado de las variables.
aEsta tabla muestra, a modo de ejemplo, un extracto de las variables y campos recogidos en el directorio de variables. Cada fila es una variable y cada columna un campo informativo. Se puede acceder al directorio completo en Google Sheets en https://goo.gl/kMBuav. Además, desde el directorio se acceder también al diccionario de variables con su códigos y etiquetado.
bLas etiquetas utilizadas en el directorio completo son: Excluida (E)/ Incluida (I)/ Construida (C).
DISCUSIÓN
Como se ha visto, la fusión de ambas ediciones de la ENSE tuvo muchas incidencias, especialmente en la muestra de adultos. Esto tiene consecuencias directas en cuanto a una pérdida importante de información interanual por la exclusión de variables (11,4%) y, más relevante aún, de fiabilidad por tener que tratar casi la mitad de las variables para su comparabilidad entre ediciones (45,5%) debido fundamentalmente a problemas de codificación más que de definición o medida. Por otra parte, las características sociodemográficas, el acceso y utilización de los servicios de salud y, especialmente, las condiciones de trabajo y empleo/desempleo son los ámbitos con comparabilidad más baja entre ediciones de la ENSE. En cuanto a la muestra de menores, la comparabilidad es mucho más alta debido fundamentalmente a que, aunque sufrió similares incidencias de codificación que la muestra de adultos, la exclusión de variables fue mucho menor.
En este trabajo describimos y proporcionamos a la comunidad científica acceso, como material online, a dos directorios, uno para la muestra de adultos y otro para la de menores. Estos contienen las variables utilizadas en el proceso de fusión de las ediciones 2006/07 y 2011/12 de la ENSE, así como información detallada de sus características, incidencias, acciones, decisiones adoptadas y un diccionario con sus etiquetas, códigos y muestra. Igualmente, proporcionamos las dos bases de datos resultantes de la fusión, una para la muestra de adultos y otra para la de menores. Esto facilitará la realización de estudios, en España y en sus Comunidades Autónomas, sobre el impacto de la crisis económica en la salud que, aunque ya existen muchos estudios10, es necesario seguir realizando más y mejores estudios empíricos que sigan explorándolo11. Además, este trabajo servirá para la evaluación, diseño y fusión de estas y otras ediciones de la ENSE, e incluso como modelo para la fusión de otras encuestas transversales de base poblacional.
Material online
Se puede acceder y descargar el directorio y diccionario de variables en Google Sheets en: https://goo.gl/kMBuav. Puede añadir comentarios a sus casillas para advertir sobre cualquier duda, error, omisión o mejora. Las bases de datos en formato CSV puede descargárselas en https://goo.gl/NbDrkb (muestra de adultos) y en https://goo.gl/ELbked (muestra de menores). Estas contienen todas aquellas variables etiquetadas como ‘incluidas’ en el directorio de variables.