Mi SciELO
Servicios Personalizados
Revista
Articulo
Indicadores
- Citado por SciELO
- Accesos
Links relacionados
- Citado por Google
- Similares en SciELO
- Similares en Google
Compartir
Gaceta Sanitaria
versión impresa ISSN 0213-9111
Gac Sanit vol.17 no.4 Barcelona jul./ago. 2003
ORIGINALES
Comparación de dos métodos en el análisis del efecto a corto
plazo de la contaminación atmosférica en la salud
C. Iñíguez a / S. Pérez-Hoyos a / F. Ballester a / M. Sáez b
aEscuela Valenciana de Estudios para la Salud (EVES). Valencia. bGrup de Recerca en Estadística, Economia Aplicada i Salut (GRECS). Departament d'Economia. Universitat de Girona. Girona. España.
Correspondencia: F. Ballester. Escuela Valenciana de Estudios para la Salud. Joan Garay, 21. 46017 Valencia. España.
Correo electrónico: ballester_fer@gva.es
Recibido: 27 de junio de 2002.
Aceptado: 17 de febrero de 2003.
(Comparison of two methods in the analysis of the short-term effect of air pollution on health)
Resumen | Abstract Objective: We compare two methods to analyse the relationship between air pollution and health. One of them (ME) is based on a generalized linear model, while the other one (MN) incorporates a generalized additive model (GAM). Besides the statistical model used, both methods schow additional discrepancies for the type and number of variables used in the control of confounding. Method: An analysis was carried out for each lag of black smoke (0 to 5) and several health indicators from the city of Valencia (Spain) following both methods. Results were compared examining the sequence and the lag of the higher coefficient. The ratio between confidence intervals width and the percent difference in the estimates were also obtained. Results: The discrepancies in results according to the methodology were small. The sequence shaped and the lag of higher coefficient generally remained invariant. Coefficients were similar (percent difference of MN over ME was not greater than 10%). Confidence intervals were more precise for MN, although the reduction was not very strong (the width ratio was around 90%). Conclusions: The short variation of the results guarantees the applicability of both MN and ME methods, although the systematic reduction of the standard error of MN supports its use as a more efficient procedure to control for confounding. Keywords: Time series. Generalized linear model. Generalized additive model. Ar pollution. |
Introducción
Desde 1990 se ha efectuado un número importante de estudios epidemiológicos sobre la asociación entre la contaminación atmosférica y la salud en diversas ciudades de todo el mundo. La mayoría ha sido diseños ecológicos en los que las series del número diario de diferentes indicadores de salud (defunciones, ingresos hospitalarios, urgencias) se relacionaban con las variaciones de los niveles de los contaminantes atmosféricos (recogidos por las redes de vigilancia) y se controlaban por los principales factores de confusión.
La metodología utilizada en este tipo de estudios ha ido evolucionando conforme se ha conocido mejor la relación entre las variables de estudio1-8, simultáneamente han avanzado las técnicas de análisis estadístico y se ha dispuesto de software más potente para llevarlo a cabo.
En la ciudad de Valencia, nuestro equipo está estudiando el impacto a corto plazo de la contaminación sobre los indicadores de mortalidad y morbilidad desde hace más de 8 años. Durante este tiempo hemos ido actualizando nuestros métodos de acuerdo con las técnicas empleadas en la literatura científica.
En los primeros estudios en Valencia9, la estacionalidad y la tendencia se controlaron mediante el uso de las variables indicador y temperatura con variables frío-calor. Posteriormente, siguiendo la metodología del estudio APHEA5, utilizamos funciones trigonométricas y polinomios para el ajuste de la estacionalidad y de las variables de temperatura y humedad, respectivamente10. Una adaptación de este método fue la aplicada en el proyecto multicéntrico EMECAM11-13. Los estudios más recientes de la bibliografía utilizan modelos aditivos generalizados (GAM) con funciones de suavizado no paramétricas, de manera que puede controlarse el efecto de las variables sin prefijar de antemano la forma de su relación con la variable respuesta14. Esta flexibilidad es muy cómoda si tenemos en cuenta el diferente comportamiento retardado de algunas variables, como la temperatura. Así, estudios previos realizados en Valencia15 y en otros lugares16 indican que la temperatura tiene una relación dinámica con los indicadores de salud (las temperaturas altas presentan un impacto casi inmediato en la salud, mientras que el efecto de las temperaturas bajas se produce a más largo plazo).
El uso de diferentes técnicas de análisis estadístico plantea la cuestión de la sensibilidad de las estimaciones al método utilizado17-18. ¿Es posible que el modelo estadístico determine los resultados obtenidos, de modo que las conclusiones extraídas puedan cambiar? En este sentido, el reanálisis de los datos originales del estudio APHEA ha mostrado que parte de la heterogeneidad en las estimaciones de los efectos de la contaminación atmosférica sobre la mortalidad entre las ciudades de Europa central y las de Europa occidental podía deberse a la aproximación estadística utilizada19. Nuestro objetivo es comparar dos métodos distintos para analizar la asociación entre contaminación atmosférica e indicadores de mortalidad y morbilidad. El primero de ellos, ME, ajusta un modelo lineal generalizado siguiendo la metodología del proyecto EMECAM, mientras que el segundo, MN, utiliza la aproximación no paramétrica (GAM) e incluye algunas variaciones referentes a la forma y selección de variables.
Material y método
Se ha analizado con ambas metodologías, ME y MN, la relación diaria entre humos negros (retardos 0 a 5) y los siguientes indicadores de salud: mortalidad por todas las causas excluidas las causas externas, mortalidad por causas respiratorias y por causas circulatorias, ingresos hospitalarios urgentes por el total de causas del aparato circulatorio, por causas cardíacas y por causas cerebrovasculares. Los datos utilizados se refieren a la ciudad de Valencia y abarcan el período de 3 años comprendido entre 1994 y 1996.
ME utiliza como modelo estadístico la regresión de Poisson, mientras que MN usa el modelo aditivo generalizado (GAM), también en la familia de regresión de Poisson. En ambas metodologías se ha seguido un proceso que consta de tres pasos. En el primero se construye un modelo que incluye variables de tendencia, de calendario, meteorológicas y de gripe. El segundo paso consiste en añadir la variable de contaminación a este modelo y, por último, se controla la posible autocorrelación seriada. Aparte del modelo empleado, las principales diferencias entre ME y MN tienen lugar en la construcción del modelo, concretamente en el tipo y número de las variables elegidas para controlar los factores de confusión.
Con la metodología ME, la construcción del modelo basal se realiza «hacia delante», es decir, a partir de un modelo inicial, sólo con la constante, que se actualiza mediante la incorporación de nuevos términos. Las variables candidatas a ser introducidas son: 6 parejas de términos sinusoidales para captar estacionalidad con período comprendido entre 2 meses y un año; una variable que refleja el tiempo transcurrido desde el principio del estudio para captar la tendencia a largo plazo; 16 términos dedicados a la temperatura (retardos 0 a 7 de las variables temperatura media diaria y el cuadrado de la misma); 16 términos análogos a los anteriores para humedad; variables indicadoras de año del estudio, días festivos y día de la semana, y 16 términos más para captar el efecto de la variable gripe (retardos 0 a 15 de la variable número diario de casos de gripe). Con anterioridad se ha publicado una descripción más detallada de la metodología EMECAM11-12.
Por el contrario, MN sigue una estrategia «hacia atrás» para la obtención del modelo basal: todos los términos a considerar están en el modelo de partida y sus parámetros (grados de libertad) se van eliminando o modificando progresivamente. La aportación del GAM es que permite la incorporación de términos no paramétricos en el modelo, lo que hace posible una mejor exploración de la forma de las relaciones y evita tener que presuponerla. Con ello se elimina la necesidad de crear las variables precisas para reproducir la forma de la relación de modo paramétrico. En nuestro caso, quedaron reducidas a una suavización mediante una regresión no paramétrica localmente ponderada (loess) de la variable que recoge el tiempo transcurrido desde el principio del estudio; dos términos de suavizado no paramétrico (splines) de promedios de retardos de la temperatura media diaria (uno para captar el efecto inmediato [retardos 0 y 1] y el otro para captar el efecto retardado [retardos 2 a 4]), dos términos análogos para humedad, los indicadores de días festivos, acontecimientos especiales y día de la semana, y un spline del promedio de los primeros retardos de la variable suavizada mediante loess del número diario de casos de gripe20.
Tras la construcción del modelo basal con las dos metodologías, siguiendo las guías antes descritas, se introdujeron sucesivamente la variable humos negros y sus retardos. El contaminante se incorporó de manera lineal en ambos casos, ME y MN, en favor de la comparabilidad de los resultados, si bien hay que decir que una de las ventajas de la nueva metodología es la posibilidad de explorar la no linealidad de la relación.
Para la comparación de los resultados se examinó la secuencia de los coeficientes para los retardos (0 a 5) del contaminante y el retardo de mayor efecto. Asimismo, se analizó el cambio porcentual del riesgo relativo (RR) (1) y el cambio en la amplitud de los intervalos de confianza (IC) para dicho RR (2).
Resultados
En la tabla 1 se recogen los descriptivos básicos de los indicadores de salud considerados y la variable humos negros. La figura 1 muestra los RR para un incremento de 1 μg/m3 y sus IC, obtenidos con las dos metodologías para cada indicador de salud y cada retardo de humos negros. La línea que une los RR trata de representar la secuencia de la relación retardada entre humos negros y los indicadores de salud. En el gráfico se aprecia claramente que la secuencia durante los retardos no ha sufrido cambios importantes en función de la metodología empleada. Tampoco los RR han experimentado grandes cambios en términos absolutos salvo, tal vez, en el caso de la morbilidad por causas cerebrovasculares (indicador que recoge un número muy reducido de casos). En cuanto al retardo de mayor efecto, es el mismo con ambas metodologías, a excepción de la mortalidad por causas respiratorias, donde el desacuerdo entre el retardo 0 y retardo 1 de ambos métodos no es importante (ambos estimadores son prácticamente el mismo) y, nuevamente, de la morbilidad por causas cerebrovasculares.
Figura 1. Riesgos relativos (RR) e intervalos de confianza del 95% para un incremento de 1 μ g/m3 en
ME y MN para los retardos de 0 a 5 de humos negros y cada indicador de salud. Para cada método y
causa se han trazado líneas entre los RR de cada retardo para poder apreciar y comparar
(con el otro método) la forma de la secuencia.
En la figura 2 se representan las medidas resumen obtenidas para todos los indicadores de salud. Se observa que la amplitud de los intervalos es sistemáticamente menor con la nueva metodología, aunque no muy diferente (la razón es superior al 85%). En cuanto a los RR, la diferencia porcentual no supera el 10%, excepto para el retardo tercero en el indicador de morbilidad por causas cerebrovasculares.
Figura 2. Medidas resumen de comparación entre las metodologías ME y MN. a) Amplitud del intervalo
de confianza obtenido con el método nuevo (MN) dividida por la amplitud obtenida con el antiguo (MA),
para cada indicador de salud y cada retardo (0 a 5) de humos negros. b) Diferencia porcentual entre
los riesgos relativos obtenidos con MN y MA, porcentaje sobre el riesgo relativo obtenido con MA,
para cada indicador de salud y cada retardo (0 a 5) de humos negros.
Discusión
Hemos comparado los dos métodos en cuanto a los resultados obtenidos y la construcción del modelo. En lo relativo a los resultados, la forma de la secuencia a lo largo de los retardos del contaminante es la misma con ME y MN y, en general, ocurre igual con el retardo de mayor efecto. Los riesgos relativos se mantienen estables: el cambio porcentual en los RR de MN sobre los de ME es inferior al 10% prácticamente en todos los casos. Por otro lado, la amplitud de los IC es un 10% menor, aproximadamente, con la nueva metodología. La escasa variación en los resultados ofrece garantías con respecto a los dos métodos de análisis, aunque el hecho de haber obtenido sistemáticamente resultados más precisos con MN en principio apoyaría la teoría de que el modelo GAM posibilita un control de la confusión más adecuado y, por tanto, aboga por el uso de la nueva metodología. Un análisis de sensibilidad de la relación entre contaminación atmosférica y mortalidad realizado en Barcelona21 también comprobó la consistencia de las asociaciones mediante la utilización de un modelo de Poisson autorregresivo y un modelo GAM.
Sin embargo, cabe reseñar que recientes investigaciones han sacado a la luz algunos problemas de la función GAM disponible en el programa SPLUS como, por ejemplo, el uso de paramétros de convergencia demasiado laxos. Una consecuencia de estos problemas (incluso usando parámetros más estrictos) es una subestimación sistemática del error estándar22. Sin embargo, se ha demostrado que la magnitud del sesgo es proporcional al tamaño de los errores estándar y no afectaría a los estimadores combinados23. Por otro lado, la nueva versión del programa ya incorpora parámetros estrictos y es inminente la corrección de la función GAM para soslayar el problema de la subestimación del error estándar23.
En lo relativo a la construcción del modelo, MN permite una exploración más exhaustiva de la forma de la relación, ya que no está sujeta a la idea preconcebida que tenga el investigador y son los propios datos los que la determinan. Se requiere un número de variables considerablemente menor al necesario en un modelo paramétrico y, por tanto, se trata de un método más sencillo y rápido en su aplicación. Además, la estrategia «hacia atrás» de MN frente a la estrategia «hacia delante» de ME da lugar a una mayor estabilidad de los coeficientes lo que, unido a la reducción del número de variables, conduce a una menor oportunidad de error. Como contrapartida, MN supone una mayor complejidad conceptual al incorporar de forma suavizada (loess, splines) algunas variables. Sin embargo, puede resultar de más difícil interpretación, al no disponer de coeficientes que cuantifiquen el efecto de las variables introducidas de forma no paramétrica, y precisa la elección de los grados de libertad que determinan la flexibilidad tolerada en la forma de la relación. Por otra parte, el modelo GAM no está incorporado en paquetes habituales, como el SPSS, sino en programas de mayor dificultad de manejo, como el SPLUS, R, SAS o el GAIM (macro que utiliza el STATA), de modo que su accesibilidad es menor para el usuario estándar.
Agradecimiento
Este trabajo ha sido financiado parcialmente con una ayuda a la investigación de la Conselleria de Sanitat, Generalitat Valenciana (020/2000) y otra del Fondo de Investigación Sanitaria (FIS 00/0010-01).
Bibliografía
1. Schwartz J, Marcus A. Mortality and air pollution in London: a time series analysis. Am J Epidemiol 1990;131:185-94. [ Links ]
2. Schwartz J. Air pollution and daily mortality in Birmingham, Alabama. Am J Epidemiol 1993;137:1136-47. [ Links ]
3. Thurston GD, Kinney L. Air pollution epidemiology: considerations in time-series modeling. Inhalation Toxicology 1995;7:71-83. [ Links ]
4. Schwartz J, Spix C, Touloumi G, Bacharova L, Barumandzadeh T, Le Tertre A, et al. Methodological issues in studies of air pollution and daily counts of deaths or hospital admissions. J Epidemiol Community Health 1996;50(Suppl 1): S3-11. [ Links ]
5. Katsouyanni K, Schwartz J, Spix C, Touloumi G, Zmirou D, Zanobetti A, et al. Short term effects of air pollution on health: a european approach using epidemiologic time series data: the APHEA protocol. J Epidemiol Community Health 1996;50(Suppl 1):S12-8. [ Links ]
6. Kelsall JE, Samet JM, Zeger S, Xu J. Air pollution and mortality in Philadelphia, 1974-1988. Am J Epidemiol 1997;146:750-62. [ Links ]
7. Schwartz J. Air pollution and hospital admissions for heart disease in eight US counties. Epidemiology 1999;10:17-22. [ Links ]
8. Daniels MJ, Dominici F, Samet JM, Zeger S. Estimating particulate matter-mortality dose-response curves and threshold levels: an analysis of daily time-series for the 20 largest us cities. Am J Epidemiol 2000;152:397-406. [ Links ]
9. Ballester F. Contaminación atmosférica, la temperatura y mortalidad: estudio en la ciudad de Valencia [tesis doctoral]. Alicante: Universitat d'Alacant, 1995. [ Links ]
10. Ballester F, Corella D, Pérez-Hoyos S, Hervás A. Air pollution and mortality in Valencia, Spain: a study using the APHEA methodology. J Epidemiol Community Health 1996;50:527-33. [ Links ]
11. Sáez M, Pérez-Hoyos S, Tobías A, Saurina C, Barceló MA, Ballester F. Métodos de series temporales en los estudios epidemiológicos sobre contaminación atmosférica. Rev Esp Salud Pública 1999;73:133-43. [ Links ]
12. Pérez-Hoyos S, Sáez M, Barceló MA, Cambra K, Figueiras A, Ordóñez JM, et al. Protocolo EMECAM: Análisis del efecto a corto plazo de la contaminación atmosférica sobre la mortalidad. Rev Esp Salud Pública 1999;73:177-85. [ Links ]
13. Tenías JM, Pérez-Hoyos S, Molina R, González J, Ballester F. Efectos a corto plazo entre contaminación atmosférica y mortalidad. Resultados del Proyecto EMECAM en la ciudad de Valencia. Rev Esp Salud Pública 1999;73:267-74. [ Links ]
14. Hastie TJ, Tisbhirani RJ, editors. Generalized additive models. London: Chapman and Hall, 1990. [ Links ]
15. Ballester F, Corella D, Pérez-Hoyos S, Sáez M, Hervás A. Mortality as a function of temperature. A study in Valencia, Spain, 1991-1993. Int J Epidemiol 1997;26:551-61. [ Links ]
16. Samet JM, Zeger S, Kelsall J, Xu J, Kalkstein LS. Does weather confound or modify the association of particulate air pollution with mortality? An analysis of the Philadelphia data, 1973-1980. Environ Research 1998;77:9-19. [ Links ]
17. Kinney L, Ito K, Thurston GD. A sensivity analysis of mortality/PM-10 associatons in Los Angeles. Inhal Toxic 1995;7:59-69. [ Links ]
18. Moolgavkar SH. Air pollution and daily mortality in three US counties. Environ Health Perspect 2000;108:777-84. [ Links ]
19. Samoli E, Schwartz J, Wojtyniak B, Touloumi G, Spix C, Balducci F, et al. Investigating regional differences in short-term effects of air pollution on daily mortality in the APHEA project: a sensitivity analysis for controlling long-term trends and seasonality. Environ Health Perspect 2001;109: 349-53. [ Links ]
20. Iñíguez C, Ballester F, Pérez-Hoyos S, Sáez M. Estimación de los casos diarios de gripe a partir de los casos declarados al sistema de enfermedades de declaración obligatoria: utilidad en estudios de series temporales [carta]. Gac Sanit 2001;15:273-5. [ Links ]
21. Tobias A, Sunyer J, Samoli E, Katsouyanni K. Contaminación ambiental y mortalidad. Análisis de sensibilidad [carta]. Gac Sanit 1999;13:73. [ Links ]
22. Dominici F, McDermott A, Zeger SL, Samet JM. On the use of generalized additive models in time-series studies of air pollution and health. Am J Epidemiol 2002;156:193-203. [ Links ]
23. Samet JM, Dominici F, McDermott A, Zeger SL. New problems for an old desing: time-series analyses of air pollution and health. Epidemiology 2003;14:11-2. [ Links ]