SciELO - Scientific Electronic Library Online

 
vol.32 issue5Towards a social determinants-oriented approach to public health: workshop reportCancer-related knowledge and health status among cancer survivors in Portugal author indexsubject indexarticles search
Home Pagealphabetic serial listing  

My SciELO

Services on Demand

Journal

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Gaceta Sanitaria

Print version ISSN 0213-9111

Gac Sanit vol.32 n.5 Barcelona Sep./Oct. 2018

http://dx.doi.org/10.1016/j.gaceta.2017.10.015 

Nota Metodológica

WebSurvCa: estimación vía web de las probabilidades de fallecimiento y de supervivencia de una cohorte

WebSurvCa: web-based estimation of death and survival probabilities in a cohort

Ramon Clèriesa  b    , Alberto Ameijidec  , Maria Buxód  , Mireia Vilardelle  , José Miguel Martínezf  , Francisco Alarcóng  , David Corderog  , Ana Díez-Villanuevag  , Yutaka Yasuih  , Rafael Marcos-Gragerai  ,  Mariai  , Marià Carullac  , Jaume Galceranc  , Ángel Izquierdoi  j  , Víctor Morenog  b  , Josep M Borràsa  b 

a Pla Director d’Oncología, IDIBELL, Hospitalet de Llobregat, Barcelona, España

b Department de Ciències Clíniques, Universitat de Barcelona, Barcelona, España

c Registre de Càncer de Tarragona, Fundació per la Prevenció del Càncer (FUNCA), IISPV, Reus, Tarragona, España

d Institut d’Investigació Biomèdica de Girona, IDIBGI, Salt, Girona, España

e Sección de Estadística, Departamento de Genética, Microbiología y Estadística, Facultad de Biología, Universitat de Barcelona, Barcelona, España

f Departamento de Investigación y Análisis de Prestaciones, MC MUTUAL, Barcelona, España

g Programa de Prevención del Cáncer, Unidad de Biomarcadores y Susceptibilidad, Institut Català de Oncología, IDIBELL, Barcelona, España

h Department of Epidemiology and Cancer Control, St. Jude Children’s Research Hospital, Memphis, Tennessee, Estados Unidos

i Registre de Cáncer de Girona, Unitat d’Epidemiologia, Pla Director d’Oncologia, Institut Català d’Oncología, Grup d’Epidemiologia Descriptiva, Genètica i Prevenció del Càncer de Girona- IDIBGI, Girona, España

j Departament d’Oncología Médica, Institut Català d’Oncología, Hospital Universitari Doctor Josep Trueta, Girona, España

RESUMEN

La supervivencia relativa se ha utilizado habitualmente como medida de la evolución temporal del exceso de riesgo de mortalidad en cohortes de pacientes diagnosticados de cáncer, teniendo en cuenta la mortalidad de una población de referencia. Una vez estimado el exceso de riesgo de mortalidad pueden calcularse tres probabilidades acumuladas a un tiempo T: 1) la probabilidad de fallecer asociada a la causa de diagnóstico inicial (enfermedad en estudio), 2) la probabilidad de fallecer asociada a otras causas, y 3) la probabilidad de supervivencia absoluta en la cohorte a un tiempo T. Este trabajo presenta la aplicación WebSurvCa (https://shiny.snpstats.net/WebSurvCa/), mediante la cual los registros de cáncer de base hospitalaria y poblacional, y los registros de otras enfermedades, estiman dichas probabilidades en sus cohortes seleccionando como población de referencia la mortalidad de la comunidad autónoma que consideren.

Palabras clave: Cáncer de mama; Supervivencia neta; Supervivencia relativa; Exceso de mortalidad; Riesgos competitivos

ABSTRACT

Relative survival has been used as a measure of the temporal evolution of the excess risk of death of a cohort of patients diagnosed with cancer, taking into account the mortality of a reference population. Once the excess risk of death has been estimated, three probabilities can be computed at time T: 1) the crude probability of death associated with the cause of initial diagnosis (disease under study), 2) the crude probability of death associated with other causes, and 3) the probability of absolute survival in the cohort at time T. This paper presents the WebSurvCa application (https://shiny.snpstats.net/WebSurvCa/), whereby hospital-based and population-based cancer registries and registries of other diseases can estimate such probabilities in their cohorts by selecting the mortality of the relevant region (reference population).

Keywords: Breast cancer; Net survival; Relative survival; Excess mortality; Competing risk

Introducción

Los datos de los registros poblacionales de enfermedades permiten estudiar el pronóstico y la supervivencia neta a una enfermedad (considerando las muertes por otras causas) de pacientes con ese diagnóstico durante un periodo de tiempo dado, siendo un ejemplo de ello los registros de cáncer1-2. Clásicamente se ha empleado la supervivencia relativa (SR) como un estimador de la supervivencia neta al cáncer de dichas/os pacientes2-3. La SR se calcula mediante el cociente entre la supervivencia absoluta (observada) (S) y la supervivencia esperada (SE) de la cohorte en función de la mortalidad de la población general (referencia) a la que pertenecen2-3. La SR supone que las/los pacientes tienen un exceso de riesgo de muerte debido a la enfermedad3, asumiendo que el/la paciente puede fallecer únicamente por la enfermedad en estudio sin tener en cuenta las otras causas de mortalidad en competición2. Utilizando la teoría de riesgos competitivos1 3-5 se ha sugerido reportar como resultado de un estudio de supervivencia en una cohorte tres probabilidades acumuladas a un tiempo T: 1) la probabilidad de fallecer por la enfermedad en estudio (PCd), 2) la probabilidad de fallecer por otras causas (POc), y como complementaria a estas, 3) la supervivencia absoluta en la cohorte (S). La utilidad clínica de la estimación de dichas probabilidades, por ejemplo, se ha visto en mujeres diagnosticadas de cáncer de mama en estadio regional, ya que permite identificar el efecto de la edad en el momento del diagnóstico en la evolución temporal de la POc y la PCd3,5. El cálculo de estas probabilidades se ha implementado en la aplicación WebSurvCa que se presenta a continuación y que permite analizar los datos de una cohorte utilizando la mortalidad de la población española.

Método

La teoría para estimar la supervivencia neta es amplia, pero resumiremos aquí los aspectos más relevantes. Definiremos λ(t) como la tasa de mortalidad por cualquier causa en una cohorte en el instante t, y λE(t) como la tasa de mortalidad esperada en la cohorte según la mortalidad de una población de referencia en dicho instante. La tasa λE(t) se calcula aplicando a cada individuo de la cohorte las tasas de mortalidad de la población de referencia2,3. El exceso de riesgo de mortalidad en el instante t es λX(t), que corresponde a la enfermedad en estudio y se define como λX(t) = λ(t) − λE(t). Por lo tanto,

λt= λXt+ λEt (1)

Teniendo en cuenta (1) y que P(t ≤ T), la probabilidad de haber fallecido por cualquier causa antes del tiempo T, se puede calcular mediante P(t ≤ T) = Pt T= OTStλtdt 1 , se puede demostrar fácilmente que, si λX(t) ≥ 0, P(t ≤ T) es la suma de dos probabilidades3-5:

PtT= OTStλXt+ λEtdt= OTStλXtdt+ OTStλEtdt=PCdt T+POc(tT) (2)

Finalmente, cabe notar que S(t > T) + P(t ≤ T) = S(t > T) + PCd(t ≤T) + POc(t ≤ T) = 1.

Además, a partir de λX(t) se puede obtener la SR acumulada a tiempo T,

SRT=exp -OTλXtdt= S(T)SE(T) (3)

A partir de la SR podemos estimar la SR a intervalos anuales (SRI), que es un indicador de “curabilidad”: si a partir de un intervalo de tiempo anual T* la SRI se mantiene en 1, es decir λX(t) = 0 para t ≥ T*, esto indica que no hay un exceso de riesgo de mortalidad respecto a la población de referencia5. La SRI se puede estimar mediante:

SRI1=exp - O1λXtdt,  SRI2=exp - 12λXtdt, .,  SRIT=exp - T-1TλXtdt

Los indicadores PCd, POc, SR(T) y SRI(T) han sido implementados en la aplicación WebSurvCa.

Implementación de WebSurvCa

En la estimación de la SR, la S(T) se ha calculado mediante el método de Kaplan-Meier, mientras que la SE(T) se calcula con el método de Ederer II6. Mediante dicho método, a cada paciente de la cohorte se le aplica la tasa de mortalidad que le correspondería a lo largo del tiempo en que se encuentra en riesgo, ya sea hasta su fallecimiento o censura, teniendo en cuenta que dicha tasa varía según el periodo del calendario, la edad y el área geográfica de procedencia. En WebSurvCa puede estimarse SE(T) teniendo en cuenta la mortalidad de la comunidad autónoma (población de referencia) durante el periodo 1980-2012. Dicha mortalidad se ha obtenido mediante los resultados nacionales, autonómicos y provinciales que provee el Instituto Nacional de Estadística. La aplicación, además, permite obtener una estimación de la SRI (T). Las ecuaciones 1 a 3 se han implementado en R utilizando las librerías “relsurv”7 y “survival”, mientras que para la aplicación web se ha utilizado la librería “shiny”8.

Ejemplo

Supongamos una cohorte de N = 646 pacientes diagnosticadas antes de los 49 años de cáncer de mama en Girona y Tarragona durante el periodo 1990-1994 y con seguimiento hasta el 31 de diciembre de 2013. Para llevar a cabo los cálculos anteriormente mencionados en una cohorte de pacientes, el usuario debe preparar un fichero en formato texto (véase un ejemplo en la Tabla I de Material suplementario) con las 10 columnas (C) siguientes: C1) identificador de paciente (con código numérico libre, lo decide el usuario); C2) edad en el momento del diagnóstico (años); C3, C4 y C5) día, mes y año de diagnóstico de la enfermedad; C6, C7 y C8) día, mes y año del último seguimiento de la paciente; C9) estado vital de la paciente (fecha de último seguimiento); y C10) sexo.

La aplicación WebSurvCa se encuentra disponible en https://shiny.snpstats.net/WebSurvCa/. Una vez cargada la base de datos en la aplicación e introducida la dirección de correo electrónico adonde se enviarán los resultados, se procede al análisis. Se obtendrá una tabla con los datos de supervivencia absoluta y relativa, y las correspondientes probabilidades (Fig. 1, pestaña Tabla Resultados).

Figura 1 Página web donde se realiza la solicitud de cálculo de las probabilidades de supervivencia y fallecimiento por causa específica y otras causas. Disponible en: https://shiny.snpstats.net/WebSurvCa  

Interpretación de los resultados

La Tabla 1 muestra los resultados. Como ejemplo, al final del primer año de seguimiento, T = 1, tenemos N = 627 pacientes a riesgo, la supervivencia absoluta (columna SupAbs) es del 97,1% (intervalo de confianza del 95% [IC95%]: 95,8-98,4%), la SR es del 97,2% (IC95%: 95,9-98,5%), la SRI es del 97,2%, la PCd acumulada (columna Prob.Cd, probabilidad de haber fallecido por cáncer durante el primer año de seguimiento) es del 2,8%, y la POc acumulada (columna Prob.OC, probabilidad de haber fallecido por otras causas durante el primer año de seguimiento) es del 0,1%. A los 20 años de seguimiento, T = 20, tenemos N = 339 pacientes a riesgo, siendo la supervivencia absoluta del 59,3% (IC95%: 55,6-63,2%), la PCd acumulada del 37,5% y la POc acumulada del 3,2%. Destacamos que la SRI no alcanza el valor 1 («curabilidad») a lo largo del seguimiento. Estos resultados se envían por correo electrónico y se representan gráficamente en R. Clèries et al. / Gac Sanit. 2018;32(5):492-495 495 la pestaña Gráfico y envío de Tabla de Resultados por e-mail (véase Fig. I de Material suplementario).

Tabla 1 Fichero resultante de la utilización de WebSurvCa con los datos de las mujeres diagnosticadas de cáncer de mama antes de los 50 años en Girona y Tarragona (N = 646) durante el periodo 1990-1994, utilizando la mortalidad de Cataluña para el cálculo de la supervivencia esperada 

T Riesgo SupAbs SupAbsLI SupAbsLS SR SR.SRLI SR.SRLS SRI Prob.Cd Prob.OC
0 646 1 1 1 1 1 1 1 0 0
1 627 0.971 0.958 0.984 0.972 0.959 0.985 0.972 0.028 0.001
2 601 0.930 0.911 0.950 0.933 0.913 0.952 0.960 0.067 0.003
3 573 0.885 0.861 0.910 0.889 0.864 0.914 0.953 0.111 0.004
4 544 0.841 0.813 0.869 0.845 0.817 0.874 0.951 0.154 0.005
5 523 0.807 0.777 0.838 0.812 0.782 0.843 0.961 0.187 0.006
6 504 0.779 0.747 0.811 0.785 0.753 0.818 0.967 0.213 0.008
7 495 0.765 0.733 0.798 0.772 0.740 0.805 0.983 0.227 0.008
8 474 0.732 0.699 0.767 0.741 0.707 0.776 0.960 0.257 0.011
9 465 0.718 0.684 0.754 0.728 0.694 0.764 0.983 0.270 0.012
10 459 0.709 0.675 0.745 0.720 0.685 0.756 0.989 0.278 0.014
11 446 0.689 0.654 0.725 0.701 0.666 0.738 0.974 0.296 0.015
12 437 0.675 0.640 0.712 0.688 0.653 0.726 0.982 0.308 0.017
13 431 0.666 0.630 0.703 0.681 0.644 0.719 0.989 0.316 0.018
14 422 0.652 0.616 0.689 0.668 0.631 0.707 0.982 0.328 0.020
15 409 0.632 0.595 0.670 0.649 0.612 0.688 0.971 0.347 0.021
16 403 0.622 0.586 0.661 0.641 0.604 0.681 0.988 0.354 0.024
17 396 0.611 0.575 0.650 0.632 0.595 0.672 0.986 0.363 0.026
18 389 0.601 0.564 0.640 0.623 0.585 0.664 0.986 0.372 0.028
19 386 0.596 0.559 0.635 0.620 0.582 0.661 0.995 0.375 0.030
20 339 0.593 0.556 0.632 0.620 0.581 0.660 0.999 0.375 0.032
21 244 0.581 0.544 0.621 0.610 0.571 0.652 0.985 0.384 0.035
22 160 0.566 0.528 0.607 0.597 0.557 0.640 0.978 0.397 0.037
23 81 0.558 0.519 0.600 0.591 0.550 0.636 0.990 0.403 0.040
24 18 0.523 0.475 0.576 0.557 0.506 0.613 0.942 0.435 0.042

T: intervalo anual, donde 0 hace referencia a la supervivencia en el año correspondiente. 0: inicio del estudio; 1 año: supervivencia al año; etc.; Riesgo: número de individuos en riesgo al inicio del intervalo; SupAbs: supervivencia absoluta; SupAbsLI: límite inferior del intervalo de confianza del 95% de la supervivencia absoluta; SupAbsLS: límite superior del intervalo de confianza del 95% de la supervivencia absoluta; SR: supervivencia relativa; SR.SRLI: límite inferior del intervalo de confianza del 95% de la supervivencia relativa; SR.SRLS: límite superior del intervalo de confianza del 95% de la supervivencia relativa; SRI: supervivencia relativa en el intervalo anual; Prob.Ca: probabilidad de fallecer por la causa de diagnóstico; Prob.OC: probabilidad de fallecer por otras causas.

Discusión

Hemos presentado la aplicación web WebSurvCa que permite estimar en una cohorte las probabilidades crudas asociadas a fallecer por la enfermedad en estudio, y por otras causas, cuando no se dispone de la causa específica de mortalidad en dicha cohorte. La aplicación WebSurvCa, a diferencia de la aplicación WAERS, que permite calcular la SR mediante el método de Hakulinen9-10, aporta tres indicadores nuevos, PCd, POc y SRI, calculados a partir del método de Ederer II. Se ha demostrado empíricamente que este método puede dar una estimación más precisa de la probabilidad de supervivencia a largo plazo en comparación con las estimaciones obtenidas mediante los métodos de Ederer I y Hakulinen10-11, e incluso se ha verificado cuando la cohorte de pacientes es relativamente «pequeña» (menos de 500 pacientes a riesgo)10 y bajo el supuesto de cohortes de pacientes cuyo seguimiento a largo plazo, más de 10 años, pueda tener sentido en función de la esperanza de vida de la población10-11. El método Ederer II, además, es el utilizado en las últimas revisiones del proyecto internacional EUROCARE12, que compara la supervivencia de los pacientes de cáncer entre diferentes países europeos.

Finalmente, cabe indicar que, dada la dependencia de la probabilidad de fallecer con la edad del diagnóstico, la estimación de dicha probabilidad aplicando WebSurvCa si la cohorte en estudio incluye pacientes de edades jóvenes y avanzadas sería una mezcla de probabilidades de fallecer entre diferentes edades5. En esta situación, la utilización de Ederer II puede llegar a sobreestimar la supervivencia a largo plazo11. Por ello, sería recomendable dividir la cohorte en ficheros con rangos de edad adecuados en función de las características de la enfermedad11-12, teniendo en cuenta el tiempo de seguimiento potencial de la cohorte (5 a 10 o más años) y la esperanza de vida de la población de referencia11. En cáncer, por ejemplo, se han propuesto cinco grupos de edad, asignando pesos diferentes a cada uno de ellos en función del tumor en estudio (véase Material suplementario)12. Para otras enfermedades, se debe investigar en este sentido.

Conclusiones

En los estudios en que no se puede determinar claramente la causa de fallecimiento, ya sea porque no está disponible, porque la calidad de los certificados de defunción es baja o porque no es posible saber la contribución de la enfermedad (tumor) a la muerte del paciente, WebSurvCa puede estimar la PCd, la POc y la supervivencia absoluta (observada) de la cohorte. La aplicación WebSurvCa se ha desarrollado para que pueda ser utilizada por registros de cáncer y otras enfermedades en España, ya que incorpora la

Anexo

Material adicional

Se puede consultar material adicional a este artículo en su versión electrónica disponible en doi:10.1016/j.gaceta.2017.10.015

Bibliografía

1. Prentice RL, Kalbeisch JD, Peterson AV, et al. The analysis of failure times in the presence of competing risks. Biometrics. 1978;34:541-54. [ Links ]

2. Ederer F, Axtell LM, Cutler SJ. The relative survival rate: a statistical methodology. Nat Can Inst Monograph. 1961;6:101-21. [ Links ]

3. Cronin KA, Feuer EJ. Cumulative cause-specific mortality for cancer patients in the presence of other causes: a crude analogue of relative survival. Stat Med. 2000;19:1729-40. [ Links ]

4. Lambert PC, Dickman PW, Nelson CP, et al. Estimating the crude probability of death due to cancer and other causes using relative survival models. Stat Med. 2010;29:885-95. [ Links ]

5. Clèries R, Buxó M, Yasui Y, et al. Estimating long-term crude probability of death among young breast cancer patients: a Bayesian approach. Tumori. 2016;102:555-61. [ Links ]

6. Ederer F, Heise H. Instructions to IBM 650 Programmers in Processing Survival Computations. Methodological Note No. 10, End Results Evaluation Section, National Cancer Institute, Bethesda, MD; 1959. [ Links ]

7. Pohar M, Stare J. Relative survival analysis in R. Comput Methods Programs Biomed. 2006;81:272-8. [ Links ]

8. Chang W, Cheng J, Allaire JJ, et al. shiny: Web Application Framework for R. R package version 1.0.0. 2017. Disponible en: https://CRAN.Rproject.org/package=shiny. [ Links ]

9. Clèries R, Ribes J, Gálvez J, et al. Cálculo automatizado de la supervivencia relativa vía web, El proyecto WAERS del Instituto Catalán de Oncología. Gac Sanit. 2005;19:71-5. [ Links ]

10. Seppä K, Hakulinen T, Läärä E, et al. Comparing net survival estimators of cancer patients. Stat Med. 2016;35:1866-79. [ Links ]

11. Pohar-Perme M, Estève J, Rachet B. Analysing population-based cancer survival - settling the controversies. BMC Cancer. 2016;16:933. [ Links ]

12. De Angelis R, Sant M, Coleman MP, et al., EUROCARE-5 Working Group. Cancer survival in Europe 1999-2007 by country and age: results of EUROCARE-5, a population-based study. Lancet Oncol. 2014;15:23-34. [ Links ]

Financiación: Esta aplicación web forma parte de los objetivos del estudio que ha sido subvencionado por el Instituto de Salud Carlos III mediante el proyecto PI14/01041 (cofinanciado por el Fondo Europeo de Desarrollo Regional/Fondo Social Europeo. “Una manera de hacer Europa”/“El FSE invierte en tu futuro”).

Historia del artículo: Recibido el 29 de junio de 2017; Aceptado el 25 de octubre de 2017; On-line el 19 de enero de 2018.

Received: June 29, 2017; Accepted: October 25, 2017

*Autor para correspondencia: Correo electrónico: r.cleries@iconcologia.net (R. Clèries).

Editora responsable del artículo: María-Victoria Zunzunegui

Contribuciones de autoría: Este estudio forma parte de un proyecto multidisciplinario en cuya concepción han participado estadísticos, informáticos y epidemiólogos de diferentes centros de investigación con el objetivo de desarrollar una aplicación web que facilite el cálculo de la supervivencia a investigadores de diversa formación. La necesidad de que dicha aplicación pueda ser utilizada en este sentido ha requerido la participación de todos los autores, tanto en la interpretación de los resultados que se derivan de un análisis estadístico llevado a cabo con dicha aplicación como en su facilidad de uso en cuanto a la preparación de los datos. La concepción del artículo es de todos los autores. Los párrafos correspondientes a la metodología y diseño web han sido redactados por R. Clèries, M. Buxó, A. Ameijide, M. Vilardell, V. Moreno y J.M. Martínez. La implementación informática se ha llevado a cabo por R. Clèries, F. Alarcón, D. Cordero y A. Díez. Los demás autores han contribuido conjuntamente a los otros apartados del trabajo. La versión final se basa en las aportaciones de todos los autores.

Conflicto de intereses: Ninguno.

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons