Introducción
Los datos de los registros poblacionales de enfermedades permiten estudiar el pronóstico y la supervivencia neta a una enfermedad (considerando las muertes por otras causas) de pacientes con ese diagnóstico durante un periodo de tiempo dado, siendo un ejemplo de ello los registros de cáncer1-2. Clásicamente se ha empleado la supervivencia relativa (SR) como un estimador de la supervivencia neta al cáncer de dichas/os pacientes2-3. La SR se calcula mediante el cociente entre la supervivencia absoluta (observada) (S) y la supervivencia esperada (SE) de la cohorte en función de la mortalidad de la población general (referencia) a la que pertenecen2-3. La SR supone que las/los pacientes tienen un exceso de riesgo de muerte debido a la enfermedad3, asumiendo que el/la paciente puede fallecer únicamente por la enfermedad en estudio sin tener en cuenta las otras causas de mortalidad en competición2. Utilizando la teoría de riesgos competitivos1 3 4-5 se ha sugerido reportar como resultado de un estudio de supervivencia en una cohorte tres probabilidades acumuladas a un tiempo T: 1) la probabilidad de fallecer por la enfermedad en estudio (PCd), 2) la probabilidad de fallecer por otras causas (POc), y como complementaria a estas, 3) la supervivencia absoluta en la cohorte (S). La utilidad clínica de la estimación de dichas probabilidades, por ejemplo, se ha visto en mujeres diagnosticadas de cáncer de mama en estadio regional, ya que permite identificar el efecto de la edad en el momento del diagnóstico en la evolución temporal de la POc y la PCd3,5. El cálculo de estas probabilidades se ha implementado en la aplicación WebSurvCa que se presenta a continuación y que permite analizar los datos de una cohorte utilizando la mortalidad de la población española.
Método
La teoría para estimar la supervivencia neta es amplia, pero resumiremos aquí los aspectos más relevantes. Definiremos λ(t) como la tasa de mortalidad por cualquier causa en una cohorte en el instante t, y λE(t) como la tasa de mortalidad esperada en la cohorte según la mortalidad de una población de referencia en dicho instante. La tasa λE(t) se calcula aplicando a cada individuo de la cohorte las tasas de mortalidad de la población de referencia2,3. El exceso de riesgo de mortalidad en el instante t es λX(t), que corresponde a la enfermedad en estudio y se define como λX(t) = λ(t) − λE(t). Por lo tanto,
Teniendo en cuenta (1) y que P(t ≤ T), la probabilidad de haber fallecido por cualquier causa antes del tiempo T, se puede calcular mediante P(t ≤ T) =
Finalmente, cabe notar que S(t > T) + P(t ≤ T) = S(t > T) + PCd(t ≤T) + POc(t ≤ T) = 1.
Además, a partir de λX(t) se puede obtener la SR acumulada a tiempo T,
A partir de la SR podemos estimar la SR a intervalos anuales (SRI), que es un indicador de “curabilidad”: si a partir de un intervalo de tiempo anual T* la SRI se mantiene en 1, es decir λX(t) = 0 para t ≥ T*, esto indica que no hay un exceso de riesgo de mortalidad respecto a la población de referencia5. La SRI se puede estimar mediante:
Los indicadores PCd, POc, SR(T) y SRI(T) han sido implementados en la aplicación WebSurvCa.
Implementación de WebSurvCa
En la estimación de la SR, la S(T) se ha calculado mediante el método de Kaplan-Meier, mientras que la SE(T) se calcula con el método de Ederer II6. Mediante dicho método, a cada paciente de la cohorte se le aplica la tasa de mortalidad que le correspondería a lo largo del tiempo en que se encuentra en riesgo, ya sea hasta su fallecimiento o censura, teniendo en cuenta que dicha tasa varía según el periodo del calendario, la edad y el área geográfica de procedencia. En WebSurvCa puede estimarse SE(T) teniendo en cuenta la mortalidad de la comunidad autónoma (población de referencia) durante el periodo 1980-2012. Dicha mortalidad se ha obtenido mediante los resultados nacionales, autonómicos y provinciales que provee el Instituto Nacional de Estadística. La aplicación, además, permite obtener una estimación de la SRI (T). Las ecuaciones 1 a 3 se han implementado en R utilizando las librerías “relsurv”7 y “survival”, mientras que para la aplicación web se ha utilizado la librería “shiny”8.
Ejemplo
Supongamos una cohorte de N = 646 pacientes diagnosticadas antes de los 49 años de cáncer de mama en Girona y Tarragona durante el periodo 1990-1994 y con seguimiento hasta el 31 de diciembre de 2013. Para llevar a cabo los cálculos anteriormente mencionados en una cohorte de pacientes, el usuario debe preparar un fichero en formato texto (véase un ejemplo en la Tabla I de Material suplementario) con las 10 columnas (C) siguientes: C1) identificador de paciente (con código numérico libre, lo decide el usuario); C2) edad en el momento del diagnóstico (años); C3, C4 y C5) día, mes y año de diagnóstico de la enfermedad; C6, C7 y C8) día, mes y año del último seguimiento de la paciente; C9) estado vital de la paciente (fecha de último seguimiento); y C10) sexo.
La aplicación WebSurvCa se encuentra disponible en https://shiny.snpstats.net/WebSurvCa/. Una vez cargada la base de datos en la aplicación e introducida la dirección de correo electrónico adonde se enviarán los resultados, se procede al análisis. Se obtendrá una tabla con los datos de supervivencia absoluta y relativa, y las correspondientes probabilidades (Fig. 1, pestaña Tabla Resultados).
Interpretación de los resultados
La Tabla 1 muestra los resultados. Como ejemplo, al final del primer año de seguimiento, T = 1, tenemos N = 627 pacientes a riesgo, la supervivencia absoluta (columna SupAbs) es del 97,1% (intervalo de confianza del 95% [IC95%]: 95,8-98,4%), la SR es del 97,2% (IC95%: 95,9-98,5%), la SRI es del 97,2%, la PCd acumulada (columna Prob.Cd, probabilidad de haber fallecido por cáncer durante el primer año de seguimiento) es del 2,8%, y la POc acumulada (columna Prob.OC, probabilidad de haber fallecido por otras causas durante el primer año de seguimiento) es del 0,1%. A los 20 años de seguimiento, T = 20, tenemos N = 339 pacientes a riesgo, siendo la supervivencia absoluta del 59,3% (IC95%: 55,6-63,2%), la PCd acumulada del 37,5% y la POc acumulada del 3,2%. Destacamos que la SRI no alcanza el valor 1 («curabilidad») a lo largo del seguimiento. Estos resultados se envían por correo electrónico y se representan gráficamente en R. Clèries et al. / Gac Sanit. 2018;32(5):492-495 495 la pestaña Gráfico y envío de Tabla de Resultados por e-mail (véase véase Fig. I de Material suplementario).
T | Riesgo | SupAbs | SupAbsLI | SupAbsLS | SR | SR.SRLI | SR.SRLS | SRI | Prob.Cd | Prob.OC |
---|---|---|---|---|---|---|---|---|---|---|
0 | 646 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 |
1 | 627 | 0.971 | 0.958 | 0.984 | 0.972 | 0.959 | 0.985 | 0.972 | 0.028 | 0.001 |
2 | 601 | 0.930 | 0.911 | 0.950 | 0.933 | 0.913 | 0.952 | 0.960 | 0.067 | 0.003 |
3 | 573 | 0.885 | 0.861 | 0.910 | 0.889 | 0.864 | 0.914 | 0.953 | 0.111 | 0.004 |
4 | 544 | 0.841 | 0.813 | 0.869 | 0.845 | 0.817 | 0.874 | 0.951 | 0.154 | 0.005 |
5 | 523 | 0.807 | 0.777 | 0.838 | 0.812 | 0.782 | 0.843 | 0.961 | 0.187 | 0.006 |
6 | 504 | 0.779 | 0.747 | 0.811 | 0.785 | 0.753 | 0.818 | 0.967 | 0.213 | 0.008 |
7 | 495 | 0.765 | 0.733 | 0.798 | 0.772 | 0.740 | 0.805 | 0.983 | 0.227 | 0.008 |
8 | 474 | 0.732 | 0.699 | 0.767 | 0.741 | 0.707 | 0.776 | 0.960 | 0.257 | 0.011 |
9 | 465 | 0.718 | 0.684 | 0.754 | 0.728 | 0.694 | 0.764 | 0.983 | 0.270 | 0.012 |
10 | 459 | 0.709 | 0.675 | 0.745 | 0.720 | 0.685 | 0.756 | 0.989 | 0.278 | 0.014 |
11 | 446 | 0.689 | 0.654 | 0.725 | 0.701 | 0.666 | 0.738 | 0.974 | 0.296 | 0.015 |
12 | 437 | 0.675 | 0.640 | 0.712 | 0.688 | 0.653 | 0.726 | 0.982 | 0.308 | 0.017 |
13 | 431 | 0.666 | 0.630 | 0.703 | 0.681 | 0.644 | 0.719 | 0.989 | 0.316 | 0.018 |
14 | 422 | 0.652 | 0.616 | 0.689 | 0.668 | 0.631 | 0.707 | 0.982 | 0.328 | 0.020 |
15 | 409 | 0.632 | 0.595 | 0.670 | 0.649 | 0.612 | 0.688 | 0.971 | 0.347 | 0.021 |
16 | 403 | 0.622 | 0.586 | 0.661 | 0.641 | 0.604 | 0.681 | 0.988 | 0.354 | 0.024 |
17 | 396 | 0.611 | 0.575 | 0.650 | 0.632 | 0.595 | 0.672 | 0.986 | 0.363 | 0.026 |
18 | 389 | 0.601 | 0.564 | 0.640 | 0.623 | 0.585 | 0.664 | 0.986 | 0.372 | 0.028 |
19 | 386 | 0.596 | 0.559 | 0.635 | 0.620 | 0.582 | 0.661 | 0.995 | 0.375 | 0.030 |
20 | 339 | 0.593 | 0.556 | 0.632 | 0.620 | 0.581 | 0.660 | 0.999 | 0.375 | 0.032 |
21 | 244 | 0.581 | 0.544 | 0.621 | 0.610 | 0.571 | 0.652 | 0.985 | 0.384 | 0.035 |
22 | 160 | 0.566 | 0.528 | 0.607 | 0.597 | 0.557 | 0.640 | 0.978 | 0.397 | 0.037 |
23 | 81 | 0.558 | 0.519 | 0.600 | 0.591 | 0.550 | 0.636 | 0.990 | 0.403 | 0.040 |
24 | 18 | 0.523 | 0.475 | 0.576 | 0.557 | 0.506 | 0.613 | 0.942 | 0.435 | 0.042 |
T: intervalo anual, donde 0 hace referencia a la supervivencia en el año correspondiente. 0: inicio del estudio; 1 año: supervivencia al año; etc.; Riesgo: número de individuos en riesgo al inicio del intervalo; SupAbs: supervivencia absoluta; SupAbsLI: límite inferior del intervalo de confianza del 95% de la supervivencia absoluta; SupAbsLS: límite superior del intervalo de confianza del 95% de la supervivencia absoluta; SR: supervivencia relativa; SR.SRLI: límite inferior del intervalo de confianza del 95% de la supervivencia relativa; SR.SRLS: límite superior del intervalo de confianza del 95% de la supervivencia relativa; SRI: supervivencia relativa en el intervalo anual; Prob.Ca: probabilidad de fallecer por la causa de diagnóstico; Prob.OC: probabilidad de fallecer por otras causas.
Discusión
Hemos presentado la aplicación web WebSurvCa que permite estimar en una cohorte las probabilidades crudas asociadas a fallecer por la enfermedad en estudio, y por otras causas, cuando no se dispone de la causa específica de mortalidad en dicha cohorte. La aplicación WebSurvCa, a diferencia de la aplicación WAERS, que permite calcular la SR mediante el método de Hakulinen9-10, aporta tres indicadores nuevos, PCd, POc y SRI, calculados a partir del método de Ederer II. Se ha demostrado empíricamente que este método puede dar una estimación más precisa de la probabilidad de supervivencia a largo plazo en comparación con las estimaciones obtenidas mediante los métodos de Ederer I y Hakulinen10-11, e incluso se ha verificado cuando la cohorte de pacientes es relativamente «pequeña» (menos de 500 pacientes a riesgo)10 y bajo el supuesto de cohortes de pacientes cuyo seguimiento a largo plazo, más de 10 años, pueda tener sentido en función de la esperanza de vida de la población10-11. El método Ederer II, además, es el utilizado en las últimas revisiones del proyecto internacional EUROCARE12, que compara la supervivencia de los pacientes de cáncer entre diferentes países europeos.
Finalmente, cabe indicar que, dada la dependencia de la probabilidad de fallecer con la edad del diagnóstico, la estimación de dicha probabilidad aplicando WebSurvCa si la cohorte en estudio incluye pacientes de edades jóvenes y avanzadas sería una mezcla de probabilidades de fallecer entre diferentes edades5. En esta situación, la utilización de Ederer II puede llegar a sobreestimar la supervivencia a largo plazo11. Por ello, sería recomendable dividir la cohorte en ficheros con rangos de edad adecuados en función de las características de la enfermedad11-12, teniendo en cuenta el tiempo de seguimiento potencial de la cohorte (5 a 10 o más años) y la esperanza de vida de la población de referencia11. En cáncer, por ejemplo, se han propuesto cinco grupos de edad, asignando pesos diferentes a cada uno de ellos en función del tumor en estudio (véase Material suplementario)12. Para otras enfermedades, se debe investigar en este sentido.
Conclusiones
En los estudios en que no se puede determinar claramente la causa de fallecimiento, ya sea porque no está disponible, porque la calidad de los certificados de defunción es baja o porque no es posible saber la contribución de la enfermedad (tumor) a la muerte del paciente, WebSurvCa puede estimar la PCd, la POc y la supervivencia absoluta (observada) de la cohorte. La aplicación WebSurvCa se ha desarrollado para que pueda ser utilizada por registros de cáncer y otras enfermedades en España, ya que incorpora la