Mi SciELO
Servicios Personalizados
Revista
Articulo
Indicadores
- Citado por SciELO
- Accesos
Links relacionados
- Citado por Google
- Similares en SciELO
- Similares en Google
Compartir
Gaceta Sanitaria
versión impresa ISSN 0213-9111
Gac Sanit vol.20 no.4 Barcelona jul./ago. 2006
NOTA METODOLÓGICA
Cálculo de la supervivencia relativa. Comparación de métodos de estimación de la supervivencia esperada
Relative survival computation. Comparison of methods for estimating expected survival
Ramón Clèries a Josepa Ribes a Víctor Moreno a Laura Esteban a Laura Pareja a Jordi Gálvez a
José Miguel Martínez b Francesc Xavier Bosch a Josep M. Borràs c
a Servei d'Epidemiologia i Registre del Càncer, Institut Català d'Oncologia, L'Hospitalet de Llobregat, Barcelona, España.
b Unitat de Recerca en Salut Laboral, Departament de Ciències Experimentals i de la Salut,
Universitat Pompeu Fabra, Barcelona, España
c Pla Director d'Oncologia de Catalunya. España.
Este trabajo se ha financiado parcialmente por las Redes de Centros de Investigación Cooperativa en Epidemiología y Salud Pública (RCESP, C03/09) y de Cáncer (C03/10) y por la beca DURSI (núm. expediente 2003XT 00023).
Dirección para correspondencia
RESUMEN
El método más utilizado en el cálculo de la supervivencia de los pacientes diagnosticados de cáncer es la supervivencia relativa. Este método tiene en cuenta la estimación de la supervivencia esperada de dichos pacientes a partir de la mortalidad observada en la zona geográfica de la que proceden. Los métodos utilizados con mayor frecuencia en dicha estimación son los de Ederer (I y II) y el método de Hakulinen. Para dichos cálculos es necesaria la disponibilidad de las tablas de supervivencia estratificadas por edad y por período de calendario. En este trabajo se presenta un ejemplo en el que se muestra cómo realizar dichos cálculos de tal forma que permitan al investigador decidir qué método es el más adecuado según el tipo de análisis que lleve a cabo. Se mostrará que, si el tiempo de seguimiento de la cohorte es inferior a 10 años, cualquiera de los métodos debería dar resultados similares. Sin embargo, el método recomendable es el de Hakulinen, ya que tiene en cuenta la heterogeneidad en el momento de las censuras debidas a posibles pérdidas de seguimiento o abandonos.
Palabras clave: Supervivencia relativa. Supervivencia esperada. Retirada del estudio. Supervivencia a largo término.A
BSTRACTRelative survival is the most commonly used method to determine survival in patients diagnosed with cancer. This method takes into account estimation of expected survival in cancer patients based on the observed mortality in the geographical area to which they belong. The most frequently used methods for estimation of expected survival are the Ederer (I and II) and Hakulinen methods. Survival tables for the geographical areas stratified by age and calendar year are required for these calculations. The present article presents an example of how to perform these estimations and how to choose the most appropriate method for the type of analysis to be performed. This article shows that if the follow-up of the cohort is less than 10 years, any of these methods should give similar results. However, the Hakulinen method is preferred, since it accounts for heterogeneity due to potential withdrawals. Key
Introducción
En un estudio longitudinal en el que se analiza el riesgo de fallecer por una determinada enfermedad, por ejemplo un tipo de cáncer, los sujetos pueden experimentar en los años siguientes al diagnóstico de la enfermedad una mortalidad más elevada que la población general1. La mortalidad de la cohorte puede deberse a la enfermedad de estudio o a otras causas no relacionadas, lo que implica la necesidad de corregir la supervivencia estimada de estos pacientes1.
Un método para determinar la proporción de pacientes que sobreviven a la enfermedad en estudio, en la hipotética situación en que ésta es la única posible causa de defunción, es la utilización de la supervivencia por causa específica1,2. En este método se consideran como eventos únicamente las muertes causadas por la enfermedad en estudio. Los tiempos de seguimiento de los pacientes que no han fallecido por dicha causa se consideran como tiempos censurados2. Este método no tiene en cuenta otras causas de fallecimiento en competición y puede originar una subestimación de la supervivencia, siendo entonces una posible alternativa el método de decrementos múltiples que corresponde a un análisis multiestado3. Otra limitación es que la disponibilidad y la calidad de los certificados de defunción no siempre son idóneas y pueden originar un sesgo en la estimación de la supervivencia por causa específica2.
Una posible solución a estos problemas es la utilización de la supervivencia relativa (SR)2,4, definida como el cociente entre la supervivencia observada (SO) y la supervivencia esperada (SE)4. En este método, la SO se calcula asumiendo que los eventos son todas las defunciones independientemente de la causa de muerte. La SE debe estimarse a partir de la mortalidad de la población residente en el área geográfica de la cual proceden los miembros de la cohorte en estudio1,4,5, y la SE es una corrección del sesgo en la estimación de la SO. Hay, al menos, 3 aplicaciones que permiten el cálculo de la SR: a) RELSURV26, un programa que permite estimar un modelo de regresión de SR a partir del método de Estève2, que además permite estimar la SE con los métodos de Ederer4,7; b) SURV38, programa que permite utilizar los métodos de Hakulinen9 y Ederer en la estimación de la SE, y c) WAERS10, una aplicación web para el cálculo de la SR mediante el método de Hakulinen y que permite al usuario seleccionar la población de referencia.
En este trabajo se describe el procedimiento para calcular la SR en función del método escogido para estimar la SE, comentando las ventajas e inconvenientes de cada uno de ellos a partir de un ejemplo hipotético.
Procedimiento de cálculo de la supervivencia relativa
Para el cálculo de la supervivencia relativa el primer paso que hay que realizar es definir el período de estudio. Supongamos que definimos este tiempo en años. El tiempo de supervivencia se define como el intervalo entre el diagnóstico de la enfermedad y el evento de interés, que en este caso es la defunción del paciente. Si el paciente no ha podido ser seguido hasta el final del período de estudio, estableceremos que su tiempo de supervivencia es censurado1. En este caso, el tiempo de seguimiento se calculará desde la fecha de diagnóstico hasta la de último contacto con el paciente. De esta forma tendremos, para cada paciente, 2 variables respuesta: tiempo de seguimiento y censura/evento. Además, de cada paciente debemos conocer la edad y el año de entrada en el estudio (diagnóstico de la enfermedad).
En el cálculo de la SO se pueden utilizar 2 estimadores: el del método actuarial (tablas de vida) o el de Kaplan-Meier (KM)1. El primer método no es tan utilizado como el segundo, debido a que consiste en dividir el período de observación en intervalos indexados como i = 1,2,3,4,... dando lugar a lo que a menudo se conoce como datos de supervivencia agrupados1,11. Este método suele utilizarse cuando sólo se conoce el año de diagnóstico y el año de fallecimiento del paciente, debido a que los pacientes tienen seguimientos de año en año sin tener en cuenta el día y el mes de fallecimiento. Si se conoce el tiempo de supervivencia exacto, es decir, la fecha exacta de diagnóstico y defunción del paciente, se utiliza el estimador de KM.
La SE se estima a partir de las tasas de supervivencia poblacionales (TSP) de la región de residencia de los miembros de la cohorte. Definamos λ como la tasa de mortalidad poblacional -por todas las causas- para los individuos de un grupo de edad y en un año en concreto en el área de residencia de los pacientes. Esta tasa puede calcularse como el cociente entre el número de fallecimientos y el número de individuos (residentes) de riesgo para ese grupo de edad y ese año en la región de procedencia de los pacientes1,12. Sea µij la TSP en el año j-ésimo para los pacientes del grupo de edad i-ésimo. A partir de λij podemos estimar μij mediante:
μij = e-λij (1)
denominándose estimador de la TSP12. Una vez determinadas las tasas para todos los años del período de estudio y para todas las edades, se aplican dichas tasas a la cohorte de pacientes en estudio.
A partir de (1), la estimación de la SE se puede llevar a cabo por 3 métodos, conocidos como Ederer I4,7, Ederer II7 y Hakulinen1,2,9,11,12.
Cálculo de la supervivencia esperada mediante los métodos de Ederer
Los métodos de Ederer se basan en calcular una supervivencia poblacional media en la cohorte para cada momento en el que se ha producido un evento. Sea ti un momento en el que se ha producido un evento y SP(ti), la supervivencia poblacional media en la cohorte en el intervalo (ti-1, ti). Si definimos SE(ti) como la supervivencia esperada a tiempo ti, la SE(ti) se calcula mediante la fórmula:
es decir, SE(ti) = SP(ti)x...xSP(t2)x SP(t1).
La diferencia entre los 2 métodos de Ederer se encuentra en el número de pacientes que se considera en cada momento. Ederer I considera para cada intervalo a todos los pacientes, mientras que Ederer II sólo considera a los que están en riesgo durante ese intervalo4,7.
Para calcular la SE(ti) mediante el método de Ederer I se sigue el siguiente esquema:
1. Determinar el tiempo mínimo y máximo de supervivencia en la cohorte, dividiendo en intervalos de igual longitud dicho tiempo.
2. Estimar para cada paciente la supervivencia poblacional que tendría en cada tiempo, aunque no esté en riesgo en dicho tiempo.
3. Calcular la media de las supervivencias poblacionales de cada individuo en ti, siendo ésta la SP(ti).
4. Aplicar (2).
A partir de este esquema se puede comprobar que el método de Ederer II consiste en modificar el paso 24,7. Veamos un ejemplo de cálculo mediante los métodos de Ederer. Supongamos una cohorte formada por 5 individuos diagnosticados de un tipo determinado de cáncer durante el período 1985-1989. La cohorte ha sido seguida durante un período de 5 años, y con edades comprendidas entre los 35 y 59 años en el momento del diagnóstico. Este seguimiento implica: a) que la cohorte habrá sido seguida, como máximo, hasta 1994, y b) que los miembros de la cohorte habrán cumplido, como máximo, 64 años al cierre del estudio. Por tanto, para la estimación de la SE nos hará falta disponer de las tasas de SP para los grupos de edad comprendidos entre 35 y 64 años durante el período 1985-1994. En la tabla 1 se muestra un ejemplo de tabla de supervivencia poblacional. Cada año de calendario queda representado por 3 filas. Las 10 columnas de la cada fila contienen las SP de los individuos por edades, siendo la primera fila las SP de los individuos de edades comprendidas entre 35 y 44 años, la segunda fila las SP de los individuos de 45-54 años y la tercera las SP de los individuos de 55-64 años. El procedimiento de cálculo de la SE de nuestro ejemplo estará basado en el seguimiento de la cohorte aplicado a los datos de esta tabla.
La tabla 2 contiene los datos de los individuos de la cohorte y un ejemplo de cálculo de la SE mediante los métodos de Ederer. Para cada individuo conocemos, además de un identificador (ID), la edad y el año de calendario de la entrada en la cohorte, su estado vital al final del seguimiento y el tiempo (en años) que éste ha sido seguido. Por ejemplo, fijémonos en el individuo número 3: este paciente entra en la cohorte en 1988 con 35 años de edad y es seguido durante 2 años. A partir de los datos de la tabla 1, la TSP para dicho paciente durante 1988 es de 0,9981. En el segundo año de seguimiento de 36 años en el año 1989, siendo de 0,9982. En el tercer año se le aplica la TSP de los individuos de 37 años en 1990, siendo 0,9980. Hasta aquí tendríamos las estimaciones necesarias para el método de Ederer II. En cambio, la utilización del método de Ederer I conlleva aplicar la TSP a los hipotéticos cuarto y quinto años de seguimiento para ese paciente. Estas TSP son las de los individuos de 38 años en 1991 y 39 años en 1992. Es decir, son los valores 0,9978 y 0,9972, respectivamente. En cada año en el que se ha producido un evento o censura, este procedimiento implica determinar una estimación de la SP para la cohorte. Por ejemplo, la SP de la cohorte calculada mediante el método de Ederer II para el segundo año de seguimiento se obtiene como la media de las SP de los individuos 2 al 5 en ese año (4 individuos). En cambio, el método de Ederer I tiene en cuenta a los 5 individuos de la cohorte. Finalmente, la SE se determina a partir de las SP que correspondan a cada método y aplicando (2).
Ambos métodos de Ederer pueden dar estimaciones similares de la SE si el tiempo máximo de seguimiento de los pacientes se encuentra entre los 5 y 10 años7,9. Pero si el seguimiento medio de la cohorte es superior a 10 años, el estimador recomendado es el obtenido por el método de Hakulinen, también denominado long-term5,9.
Cálculo de la supervivencia esperada mediante el método de Hakulinen
En la aplicación del método de Hakulinen, la estimación de la SE se realiza mediante la utilización de un estimador similar al de KM que tiene en cuenta las censuras. Es decir, el número de pacientes de riesgo de cada intervalo se calcula teniendo en cuenta un número de abandonos esperados en dicho tiempo. El procedimiento se basa en determinar para cada intervalo el número de pacientes de riesgo. Sea ri el número de pacientes de riesgo a tiempo ti, la suma de las SP de cada uno de los ri pacientes de riesgo es un estimador del número de pacientes de riesgo esperados, que definimos como ri*. De esta forma tenemos que ri - ri* nos da el número de defunciones esperadas, di*. Finalmente, el número de abandonos esperados en el intervalo wi se calcula aplicando una corrección a la suma de las SP de los individuos en riesgo en dicho intervalo y cuyo tiempo de seguimiento no exceda ese intervalo. Esta corrección se denomina «anticipación al tiempo de censura»9, habitualmente 1/2. De esta forma, el estimador de la SE(ti) mediante el método de Hakulinen es:
Cálculo del intervalo de confianza para la supervivencia relativa
Para el cálculo de la varianza de la SR(ti), se considera una transformación log-log complementaria a la SO(ti)11. Sea LSO(ti) = log(-log(SO(ti)), cuya varianza puede ser aproximada mediante el método delta11:
A partir de (4), y considerando SE(ti) como una constante, se pueden obtener los límites inferior y superior de un intervalo de confianza a nivel α para la SR(ti). Sea X1 (¡ti) =
siendo el valor de la distribución normal estándar que deja un área a su derecha de , los límites del intervalo de confianza se obtienen mediante:
Ejemplo
En el siguiente ejemplo se calcula la SR de los pacientes diagnosticados de cáncer de próstata del registro hospitalario de tumores del Instituto Catalán de Ontología y del Hospital Universitario de Bellvitge13. Estos pacientes han entrado en el período 1991-2000 y han sido seguidos hasta 2001. De éstos, se ha seleccionado a los residentes en Cataluña, que son un total de 1.354. La edad media de los pacientes es de 65 años (error estándar = 4,5; rango, 46-73). Para el cálculo de la SE ha sido necesario disponer de las tablas de mortalidad de Cataluña en el período 1991-2001 y para los grupos de edad de 46-84 años. El seguimiento máximo para estos pacientes se observa en los que entraron en 1991 y están vivos al final del seguimiento, es decir, 11 años. En la tabla 3 se muestran las estimaciones de las SE según los 3 métodos. La primera columna indica el intervalo de tiempo de seguimiento, la segunda el número de individuos de riesgo, la tercera el número de individuos que fallecen a final de cada intervalo, la cuarta la SO, la quinta el error estándar de la SO y, finalmente, en las 3 últimas se encuentran las estimaciones de la SE según los tres métodos. Como puede observarse, los métodos de Ederer dan estimaciones muy similares de la SE con valores superiores a la SE estimada mediante el método de Hakulinen, tal como se puede observar en la figura 1. En la tabla 4 se muestran las estimaciones de la SR a partir de los 3 métodos. Nótese que a partir del séptimo año de seguimiento la SR calculada mediante la estimación de la SE utilizando el método de Hakulinen es superior a la estimada por los métodos de Ederer. Por otro lado, a partir del séptimo año, la curva de SR calculada a partir de la estimación de la SE por el método de Ederer II se asemeja a la curva de SR que utiliza la SE estimada mediante el método de Hakulinen (fig. 2).
Observaciones y comparación de los métodos de cálculo de la supervivencia esperada
En el cálculo de la SR quedan definidos claramente 3 procedimientos: disposición de las tablas de mortalidad, estimación de la supervivencia esperada y determinación de la SR.
El primer paso presenta 2 inconvenientes: a) la disponibilidad de las TSP de la población de referencia en el período en el que se realiza el estudio, y b) el coste de preparación de los datos. Supongamos, por ejemplo, que no disponemos de las TSP del período 1999-2000, pero sí las del año 1998. En tal caso podemos utilizar en dicho período las TSP de 1998 o incluso realizar una extrapolación. Ambas posibilidades pueden conllevar un sesgo en las estimaciones de la SR11 sólo evaluable a posteriori, cuando se disponga de las tasas para el período.
La elección del método de estimación de la SE es el apartado más discutible acerca del cálculo de la SR. Tanto el método de Ederer II como el de Hakulinen son los recomendables, ya que minimizan el sesgo en la estimación de la SE que se puede dar por la heterogeneidad de las edades de los pacientes de la cohorte4,7,9. En un análisis de SR a largo plazo y cuando hay pocos individuos de riesgo, el método de Ederer I puede sobrestimar la SE y, por lo tanto, subestimar la SR4,9,11. En el ejemplo utilizado anteriormente, se observa la tendencia a la sobrestimación de la SE mediante el método de Ederer I (tabla 3 y fig. 1). Se ha descrito que sólo en el caso de estratificación por grupos de edad es indiferente la utilización de cualquiera de los 3 métodos, aunque se recomienda el método de Ederer I únicamente en modelos de curabilidad9,11.
Este sesgo también puede darse en la comparación de curvas de SR mediante modelos de regresión. Estos modelos permiten determinar, por ejemplo, el efecto de la edad y el estadio de la enfermedad en la supervivencia relativa. Entre ellos cabe destacar el modelo de Estève de riesgos proporcionales2,14 y los modelos de Hakulinen-Tenkanen11,14 y Dickman14, basados en modelos lineales generalizados. Para estos modelos es preferible la estimación de la SE mediante los métodos de Ederer II y de Hakulinen8,11. A pesar de ello, el método de Ederer II no tiene en cuenta una posible heterogeneidad entre abandonos, por lo que se recomienda el método de Hakulinen como método estándar.
Cabe destacar que hay una posible metodología alternativa al método de Hakulinen, denominada método de Verheul15. Dicha metodología modifica los tiempos potenciales de censuras, pero se ha comprobado que las estimaciones de la SE con dicho método no presentan diferencias con las obtenidas mediante el método de Hakulinen11,15.
Conclusiones
Para evitar los sesgos en la estimación de la SE, es recomendable el cálculo de la SR subdividiendo, cuando sea posible, la cohorte en grupos de edad. Si esta subdivisión no es posible o el tiempo de seguimiento medio es superior a 10 años, el método de Hakulinen es el recomendable.
Bibliografía
1. Estève J, Benhamou E, Raymond L. Statistical Methods in Cancer Research. Descriptive Epidemiology. IARC Scientific Publications, N.o 128. Lyon: IARC; 1994. [ Links ]
2. Estève J, Benhamou E, Croasdale M, Raymond L. Relative survival and the estimation of net survival: elements for further discussion. Stat Med. 1990;9:529-38. [ Links ]
3. Llorca J, Delgado-Rodríguez. Análisis de supervivencia en presencia de riesgos competitivos: estimadores de la probabilidad de suceso. Gac Sanit. 2004;18:391-7. [ Links ]
4. Ederer F, Axtell LM, Cutler SJ. The relative survival rate: a statistical methodology. Natl Cancer Inst Monogr. 1961;6:101-21. [ Links ]
5. Hakulinen T. On long-term relative survival rates. J Chronic Dis. 1977;30:431-43. [ Links ]
6. Hédelin G. RELSURV 2.0: a program for relative survival analysis. Estrasburgo: Department of Epidemiology and public health, Faculty of Medicien, Louis Pasteur University; 1997. [ Links ]
7. Ederer F, Heise H. The effect of eliminating deaths from cancer on general population survival rates, methodological note 11. End results evaluation section. National Cancer Institute; 1959. [ Links ]
8. Dickman PW, Hakulinen T, Voutilainen ET. SURV3, Relative Survival Analysis. Helsinki: Finnish Cancer Registry; 2000. [ Links ]
9. Hakulinen, T. Cancer survival corrected for heterogeneity in patient withdrawal. Biometrics. 1982;38:933-42. [ Links ]
10. Clèries R, Ribes J, Gálvez J, Melià A, Moreno V, Bosch FX. Cálculo automatizado de la supervivencia relativa vía web. El proyecto WAERS del Instituto Catalán de Oncología. Gac Sanit. 2005;19:71-5. [ Links ]
11. Dickman P. Teaching and seminars [citado 10 Jun 2006]. Disponible en: http://www.pauldickman.com/teaching/index.php [ Links ]
12. Therneau TM, Grambsch PM. Modeling survival data: extending the Cox model. New York: Springer-Verlag; 2000. [ Links ]
13. Registre Hospitalari de Tumors ICO/CSUB [citado 2 Oct 2005]. Disponible en: http://rht.iconcologia.net [ Links ]
14. Dickman PW, Sloggett A, Hills M, Hakulinen T. Regression models for relative survival. Stat Med. 2004;23:51-64. [ Links ]
15. Verheul HA, Dekker E, Bossuyt P, Moulijn AC, Dunning AJ. Background mortality in clinical survival studies. Lancet. 1993;341:872-5. [ Links ]
Dirección para correspondencia:
Dr. Ramón Clèries.
Servei d'Epidemiologia i Registre del Càncer.
Institut Català d'Oncologia.
Gran Via, s/n, km 2,7. 08907 L'Hospitalet de Llobregat. Barcelona. España.
E-mail: r.cleries@iconcologia.net
Recibido: 4 de noviembre de 2005.
Aceptado: 8 de marzo de 2006.