Introducción
Durante la crisis de salud internacional provocada por la pandemia de COVID-19 se hace necesario no solo conocer los datos sobre contagios, muertes y ocupación hospitalaria, sino también hacer predicciones que ayuden a la propia gestión de la crisis por parte de las autoridades sanitarias.
El presente trabajo tiene como objetivo describir la metodología utilizada para la elaboración de modelos predictivos de contagios y defunciones para la epidemia de COVID-19 en España. Los datos utilizados, desde el 4 de marzo hasta el 22 de abril de 2020, fueron los datos oficiales que ofrecía diariamente el Ministerio de Sanidad de España1.
Exposición del método
Para las modelizaciones se siguió el siguiente esquema, simplificación del descrito por Lega y Brown2:
Con los datos acumulados diarios se calculó la curva de Gompertz3 de tres parámetros que mejor se ajustaba en cada caso a los datos:
Se utilizó el modelo de crecimiento de Gompertz en lugar de otros, como el logístico o el de Bertalanffy, por haber demostrado ser algo más preciso para predecir los casos acumulados fuera de la provincia china de Hubei4, lugar donde se originó la pandemia de COVID-19.
Para el ajuste de la curva de Gompertz a los datos acumulados observados se usaron los algoritmos de Nelter-Mead5 implementados por Nash6. El software utilizado para los cálculos fue R7 a través del paquete drc8.
De esta manera obtuvimos modelizada la curva de casos acumulados, con la que pudimos estimar cuántos casos acumulados se observarían cualquier día determinado. Esta curva depende exclusivamente de los casos acumulados observados, ya que es la única información que la nutre.
El coeficiente a de la curva se corresponde con su asíntota superior, lo que puede interpretarse como el «horizonte» de la epidemia, esto es, el número de casos esperados al final de esta.
La primera derivada de la función anterior9, la interpretamos como la curva del número de casos diarios:
A través de ella se pueden calcular los valores esperados los días futuros. El punto donde esta función alcanza el máximo puede interpretarse como el pico de la epidemia.
Aplicación práctica
En el momento en que se publican nuevos datos diarios se vuelve a calcular un modelo según el esquema anterior para los contagios y otro para las defunciones en cada comunidad autónoma y para el total del país.
Para el presente trabajo se calcularon 50 modelos de contagios y 50 de fallecimientos para cada una de las comunidades autónomas (dos modelos diarios, desde el 4 de marzo hasta el 22 de abril, cada día un modelo).
Según esta metodología, el pico de contagios se alcanzó en España aproximadamente a finales de marzo, mientras que el pico de defunciones se estimó a primeros de abril de 2020. Los resultados concretos de los picos de las curvas, además de los horizontes, pueden consultarse en la app interactiva: https://www.easp.edu.es/data-apps/covid-easp/covid19_ESP/
La Figura 2 muestra la evolución de los horizontes (coeficientes a de los modelos) que se fueron calculando diariamente y a lo largo del tiempo. A modo de ejemplo, los modelos predecían más de 900.000 casos de contagio y unas 67.000 muertes en torno al 27 de marzo para el total de España, y a medida que se sucedieron los días estos horizontes estimados descendieron hasta situarse alrededor de 240.000 contagios y 25.000 fallecidos. A partir de los primeros días de abril, esas estimaciones permanecen estables a lo largo del tiempo. De manera general se observa que, en todos los casos, al principio el comportamiento de la serie de horizontes era algo errática, pero a medida que avanzaron los días el parámetro fue estabilizándose, lo cual se puede interpretar como medida de robustez de la estimación del número de contagiados y de fallecidos para cada comunidad autónoma.
A partir de las curvas de contagios diarios y de defunciones diarias (g(t)) se hizo una estimación de las fechas en que no se observarán más contagios ni más defunciones (Tabla 1). Hay que hacer notar que tanto las predicciones de estas fechas como las de los horizontes son orientativas y no serán precisas si la situación epidemiológica varía sustancialmente.
Comunidad autónoma | Modelos de contagiados | Modelos de fallecidos | ||||||
---|---|---|---|---|---|---|---|---|
b (IC95%) | a (IC95%) | c (IC95%) | Fecha fin | b (IC95%) | a (IC95%) | c (IC95%) | Fecha fin | |
Andalucía | -0.102 (-0.106,-0.097) | 12701.872 (12449.056,12954.688) | 25.492 (25.204,25.78) | 10/06/20 | -0.084 (-0.088,-0.079) | 1375.354 (1322.365,1428.343) | 33.743 (33.179,34.307) | 05/06/20 |
Aragón | -0.1 (-0.106,-0.095) | 5468.242 (5322.385,5614.099) | 27.084 (26.707,27.461) | 04/06/20 | -0.084 (-0.09,-0.079) | 880.491 (833.967,927.014) | 35.187 (34.43,35.944) | 01/06/20 |
Asturias | -0.078 (-0.083,-0.073) | 2727.282 (2628.178,2826.386) | 25.458 (24.83,26.086) | 09/06/20 | -0.061 (-0.066,-0.056) | 351.555 (319.567,383.542) | 38.859 (37.219,40.5) | 05/06/20 |
Baleares | -0.116 (-0.124,-0.107) | 1828.794 (1779.225,1878.363) | 23.256 (22.857,23.654) | 15/05/20 | -0.075 (-0.083,-0.067) | 223.425 (203.344,243.506) | 34.923 (33.49,36.356) | 18/05/20 |
Canarias | -0.121 (-0.126,-0.116) | 2169.584 (2139.665,2199.502) | 22.922 (22.719,23.126) | 14/05/20 | -0.123 (-0.135,-0.112) | 123.78 (119.256,128.304) | 26.745 (26.271,27.22) | 23/04/20 |
Cantabria | -0.113 (-0.125,-0.102) | 2140.596 (2056.683,2224.509) | 24.561 (24.002,25.12) | 18/05/20 | -0.081 (-0.089,-0.074) | 219.775 (203.95,235.599) | 34.6 (33.519,35.681) | 16/05/20 |
Castilla-La Mancha | -0.088 (-0.092,-0.085) | 20389.014 (19938.915,20839.113) | 29.434 (29.107,29.762) | 29/06/20 | -0.083 (-0.086,-0.079) | 2619.466 (2538.272,2700.66) | 31.887 (31.413,32.362) | 12/06/20 |
Castilla y León | -0.069 (-0.073,-0.064) | 22078.697 (20977.38,23180.014) | 31.945 (31.061,32.829) | 24/07/20 | -0.107 (-0.109,-0.105) | 1715.048 (1698.215,1731.88) | 29.785 (29.657,29.914) | 24/05/20 |
Cataluña | -0.086 (-0.09,-0.081) | 49227.704 (47679.816,50775.591) | 27.969 (27.476,28.462) | 10/07/20 | -0.129 (-0.134,-0.123) | 4313.684 (4238.415,4388.953) | 27.729 (27.507,27.95) | 22/05/20 |
Ceuta | -0.157 (-0.183,-0.131) | 115.651 (109.642,121.66) | 28.416 (27.846,28.987) | 21/04/20 | -0.262 (-0.393,-0.131) | 4.229 (3.926,4.533) | 30.558 (29.353,31.763) | 13/04/20 |
C. Valenciana | -0.099 (-0.105,-0.094) | 11321.285 (11039.421,11603.15) | 25.324 (24.954,25.694) | 10/06/20 | -0.095 (-0.099,-0.091) | 1295.589 (1265.824,1325.353) | 30.546 (30.225,30.867) | 27/05/20 |
Extremadura | -0.085 (-0.095,-0.074) | 3688.372 (3434.953,3941.79) | 26.766 (25.66,27.873) | 09/06/20 | -0.107 (-0.113,-0.102) | 446.697 (434.893,458.501) | 29.8 (29.454,30.146) | 11/05/20 |
Galicia | -0.118 (-0.123,-0.113) | 8960.746 (8820.319,9101.173) | 26.091 (25.881,26.302) | 30/05/20 | -0.102 (-0.106,-0.097) | 429.271 (418.027,440.516) | 32.36 (32.024,32.697) | 15/05/20 |
Madrid | -0.079 (-0.085,-0.074) | 67301.118 (64827.97,69774.266) | 26.79 (26.183,27.397) | 20/07/20 | -0.098 (-0.101,-0.096) | 8196.958 (8097.911,8296.005) | 26.119 (25.941,26.297) | 09/06/20 |
Melilla | -0.086 (-0.095,-0.077) | 125.585 (119.102,132.067) | 24.356 (23.502,25.211) | 27/04/20 | -0.23 (-0.282,-0.177) | 2.059 (1.949,2.17) | 24.6 (23.781,25.42) | 13/04/20 |
Murcia | -0.111 (-0.119,-0.103) | 1753.878 (1707.227,1800.529) | 23.685 (23.296,24.073) | 16/05/20 | -0.132 (-0.14,-0.125) | 131.682 (128.555,134.809) | 30.778 (30.505,31.051) | 27/04/20 |
Navarra | -0.083 (-0.087,-0.08) | 5570.162 (5450.229,5690.095) | 26.716 (26.369,27.063) | 15/06/20 | -0.054 (-0.068,-0.04) | 717.719 (485.336,950.102) | 40.721 (34.291,47.151) | 25/06/20 |
País Vasco | -0.089 (-0.093,-0.085) | 14460.898 (14126.727,14795.07) | 25.938 (25.58,26.296) | 21/06/20 | -0.063 (-0.065,-0.061) | 1714.421 (1662.367,1766.474) | 35.81 (35.261,36.36) | 26/06/20 |
La Rioja | -0.057 (-0.063,-0.051) | 6587.953 (5963.087,7212.819) | 32.749 (30.823,34.675) | 23/07/20 | -0.074 (-0.078,-0.071) | 409.187 (392.912,425.462) | 34.138 (33.497,34.779) | 26/05/20 |
Total | -0.085 (-0.089,-0.082) | 235897.171 (230282.564,241511.779) | 27.223 (26.849,27.596) | 28/07/20 | -0.094 (-0.096,-0.092) | 24582.574 (24249.75,24915.399) | 29.098 (28.903,29.293) | 26/06/20 |
IC95%: intervalo de confianza del 95%. Coeficientes a, b y c de las curvas de Gompertz (G(t) y g(t)). Las fechas de fin se calcularon resolviendo la ecuación g(t) = 0,75, esto es, el tiempo t en el que se esperaba menos de un caso en la curva de casos diarios g(t).
Conclusiones
Presentamos en este trabajo una metodología de fácil uso para modelizar epidemias como la de COVID-19. Consideramos que en esta sencillez radica su fortaleza, ya que se utilizan exclusivamente los datos sobre contagios y defunciones que después se predicen, sin contar con ningún tipo de covariable externa para su cálculo. Esto, por una parte, podría parecer una debilidad al no añadir más información a los modelos, pero así se evita el ruido que podrían introducir esas hipotéticas variables externas. Por otra parte, la ausencia de más información hace que la calidad de las predicciones dependa mucho de la calidad de los datos.
Hay que tener en cuenta que las predicciones de los modelos de contagios, sobre todo a partir de aproximadamente la tercera semana de abril de 2020, pueden sufrir grandes variaciones con respecto a los valores observados por los cambios en la definición de caso. No ocurre lo mismo con respecto a los modelos de defunciones, que son más robustos a lo largo del tiempo al no haber sufrido grandes cambios en su definición.
Con respecto a las fechas estimadas del fin de la epidemia en cada comunidad autónoma, hay que tener en cuenta que son estimaciones aproximadas y que pueden sufrir alteraciones si se producen cambios bruscos en las tendencias. De hecho, los modelos predecían horizontes de muchos más casos y defunciones a finales de marzo que a partir de la segunda quincena de abril, lo que puede deberse a las medidas de confinamiento tomadas por las autoridades, que tienen un efecto en las curvas de la epidemia a partir de al menos una semana desde su implantación10.
En cuanto al fin de la epidemia, las fechas en las que se espera que no haya defunciones son anteriores a las fechas en las que se espera que no haya contagios, y esto tiene mucho sentido dado que no todas las personas contagiadas fallecerán y que el porcentaje de personas que sobreviven a la enfermedad es mucho mayor que el de las personas que fallecen.
En cualquier caso, en este trabajo presentamos una metodología utilizada para modelizar la epidemia de COVID-19 en España y en sus comunidades autónomas, y el valor que le damos es referente al contexto temporal de la epidemia, aunque somos conscientes de que pasada la crisis esta metodología puede ser matizada.