<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0213-9111</journal-id>
<journal-title><![CDATA[Gaceta Sanitaria]]></journal-title>
<abbrev-journal-title><![CDATA[Gac Sanit]]></abbrev-journal-title>
<issn>0213-9111</issn>
<publisher>
<publisher-name><![CDATA[Sociedad Española de Salud Pública y Administración Sanitaria (SESPAS)]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0213-91112005000400011</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Análisis estadístico de polimorfismos genéticos en estudios epidemiológicos]]></article-title>
<article-title xml:lang="en"><![CDATA[Statistical analysis of genetic polymorphisms in epidemiological studies]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Iniesta]]></surname>
<given-names><![CDATA[Raquel]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Guinó]]></surname>
<given-names><![CDATA[Elisabet]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Moreno]]></surname>
<given-names><![CDATA[Víctor]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Instituto Catalán de Oncología Instituto de Investigación Biomédica de Bellvitge (IDIBELL) Servicio de Epidemiología y Registro del Cáncer]]></institution>
<addr-line><![CDATA[L'Hospitalet de Llobregat Barcelona]]></addr-line>
<country>España</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Autónoma de Barcelona Facultad de Medicina Unidad de Bioestadística]]></institution>
<addr-line><![CDATA[ Barcelona]]></addr-line>
<country>España</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>08</month>
<year>2005</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>08</month>
<year>2005</year>
</pub-date>
<volume>19</volume>
<numero>4</numero>
<fpage>333</fpage>
<lpage>341</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.isciii.es/scielo.php?script=sci_arttext&amp;pid=S0213-91112005000400011&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.isciii.es/scielo.php?script=sci_abstract&amp;pid=S0213-91112005000400011&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.isciii.es/scielo.php?script=sci_pdf&amp;pid=S0213-91112005000400011&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[El análisis de los polimorfismos genéticos permite identificar genes que confieren susceptibilidad a presentar enfermedades. En este trabajo se presenta la nomenclatura utilizada en la bibliografía de epidemiología genética y una estrategia básica de análisis estadístico de estudios epidemiológicos que incorporan estos marcadores. En primer lugar, se presenta el análisis descriptivo de un único polimorfismo y la evaluación del equilibrio Hardy-Weinberg. A continuación se presentan los métodos para evaluar la asociación con la enfermedad. Para ello se emplean modelos de regresión logística y se estudian los posibles modelos de herencia. Por último, se presentan métodos para el análisis simultáneo de múltiples polimorfismos: estimación de las frecuencias de haplotipos y análisis de asociación con la enfermedad.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Analysis of genetic polymorphisms allows the genes that confer susceptibility to diseases to be analyzed. This paper presents the nomenclature used in genetic epidemiology literature and a basic strategy for statistical analysis of epidemiological studies that use genetic markers. First, a descriptive analysis of a single nucleotide polymorphism is presented, with assessment of Hardy-Weinberg equilibrium. Next, methods to assess the association with disease are presented. To do this, logistic regression models are used and alternative models of inheritance are explored. Finally, methods for the simultaneous analysis of multiple polymorphisms are presented: haplotype frequency estimation and analysis of disease association.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Epidemiología genética]]></kwd>
<kwd lng="es"><![CDATA[Polimorfismo]]></kwd>
<kwd lng="es"><![CDATA[Genotipo]]></kwd>
<kwd lng="es"><![CDATA[Haplotipo]]></kwd>
<kwd lng="es"><![CDATA[Análisis estadístico]]></kwd>
<kwd lng="en"><![CDATA[Genetic epidemiology]]></kwd>
<kwd lng="en"><![CDATA[Polymorphism]]></kwd>
<kwd lng="en"><![CDATA[Genotype]]></kwd>
<kwd lng="en"><![CDATA[Haplotype]]></kwd>
<kwd lng="en"><![CDATA[Statistical analysis]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <FONT face=Arial size=2>    <P align="center"><B>NOTA METODOLÓGICA</B></P> <hr color="#000000"> </FONT>     <P align="center"><B><font face="Arial" size="4">Análisis  estadístico de polimorfismos genéticos </font></B><B><font face="Arial" size="4">en estudios  epidemiológicos</font></B></P>    <P align="center"><FONT face=Arial size=2><b>Raquel Iniesta<SUP>a</SUP>  / Elisabet Guinó<SUP>a</SUP>  / Víctor Moreno<SUP>a,b</SUP></b><SUP>    <br> </SUP><SUP>a</SUP>Servicio de Epidemiología y Registro  del Cáncer, IDIBELL, Instituto Catalán de Oncología, L'Hospitalet de Llobregat,  Barcelona. España;    <br> <SUP>b</SUP>Unidad de Bioestadística, Facultad de Medicina, Universidad  Autónoma de Barcelona, Barcelona, España.    <br> </FONT></P> <table border="0" width="100%">   <tr>     <td width="48%" valign="top"></td>     <td width="4%" valign="top"></td>     <td width="48%" valign="top"><B><FONT face=Arial size=2>(Statistical analysis of  genetic polymorphisms in epidemiological studies)</FONT>       </B></td>   </tr> </table> <FONT face=Arial size=2> <hr color="#000000"> <table border="0" width="100%">   <tr>     <td width="48%" valign="top"><FONT face=Arial size=2><FONT size=2><b>Resumen</b>    <br>       El análisis de los polimorfismos genéticos permite identificar  genes que confieren susceptibilidad a presentar enfermedades. En este trabajo se  presenta la nomenclatura utilizada en la bibliografía de epidemiología genética  y una estrategia básica de análisis estadístico de estudios epidemiológicos que  incorporan estos marcadores. En primer lugar, se presenta el análisis  descriptivo de un único polimorfismo y la evaluación del equilibrio Hardy-Weinberg. A continuación se presentan los métodos para evaluar la  asociación con la enfermedad. Para ello se emplean modelos de regresión  logística y se estudian los posibles modelos de herencia. Por último, se  presentan métodos para el análisis simultáneo de múltiples polimorfismos:  estimación de las frecuencias de haplotipos y análisis de asociación con la  enfermedad.    <br>       </FONT><b>Palabras clave:</b> Epidemiología genética. Polimorfismo.  Genotipo. Haplotipo. Análisis estadístico.</FONT>     </td>     <td width="4%" valign="top"></td>     <td width="48%" valign="top"><FONT face=Arial size=2><FONT size=2><b>Abstract</b>    <br>       Analysis of genetic polymorphisms allows the genes that confer  susceptibility to diseases to be analyzed. This paper presents the nomenclature  used in genetic epidemiology literature and a basic strategy for statistical  analysis of epidemiological studies that use genetic markers. First, a  descriptive analysis of a single nucleotide polymorphism is presented, with  assessment of Hardy-Weinberg equilibrium. Next, methods to assess the  association with disease are presented. To do this, logistic regression models  are used and alternative models of inheritance are explored. Finally, methods  for the simultaneous analysis of multiple polymorphisms are presented: haplotype  frequency estimation and analysis of disease association.    ]]></body>
<body><![CDATA[<br>       </FONT><b>Keywords: </b>  Genetic epidemiology. Polymorphism. Genotype. Haplotype. Statistical analysis.</FONT>     </td>   </tr> </table> <hr color="#000000"> </FONT>     <P><FONT face=Arial size=2>Correspondencia: Dr. Víctor Moreno.    <br> Servicio de Epidemiología y Registro del Cáncer.    <br> Instituto Catalán de Oncología.    <br> Gran Vía, km 2,7. 08970 L'Hospitalet de Llobregat. Barcelona.    <br> España.    <br> Correo electrónico: <a href="mailto:v.moreno@ioncologia.net" target="_blank">v.moreno@ioncologia.net</a></FONT></P>    <P><font size="2" face="Arial"><i>Recibido</i>: 5 de octubre de 2004. <i>Aceptado</i>: 12 de enero de 2005.</font></P>    <P>&nbsp;</P>    <P><B><FONT face=Arial size=2>Introducción</FONT></B></P>    ]]></body>
<body><![CDATA[<P><FONT face=Arial size=2>Los polimorfismos genéticos son variantes del genoma que aparecen por mutaciones  en algunos individuos, se transmiten a la descendencia y adquieren cierta  frecuencia en la población tras múltiples generaciones. Se ha estimado que hay  una variante en cada 1.000 pares de bases de los 3.000 millones que configuran  el genoma humano. Los polimorfismos son la base de la evolución y los que se  consolidan, bien pueden ser silentes o proporcionar ventajas a los individuos,  aunque también pueden contribuir a causar enfermedades<SUP>1</SUP>. Se conocen  muchas enfermedades determinadas genéticamente por mutaciones o variantes  denominadas de «alta penetrancia», ya que los portadores de la variante suelen  manifestar la enfermedad con una alta probabilidad. Estas variantes suelen ser  de baja frecuencia en la población general, por ejemplo, las mutaciones  heredadas en el gen supresor de tumores <I>APC</I> determinan la aparición de la  poliposis familiar adenomatosa que a menudo degenera en carcinomas en el colon,  pero esta entidad no explica más de un 1% del total de tumores de  colon.</FONT></P>     <P><FONT face=Arial size=2>En la actualidad muchos investigadores  centran sus trabajos en identificar genes con polimorfismos que se dan en la  población con mayor frecuencia y que influyen en el riesgo de padecer una  enfermedad, pero con baja probabilidad (son los llamados polimorfismos de «baja  penetrancia»). También se les denomina variantes que confieren susceptibilidad  genética a la enfermedad, y para que dicha variante genética se exprese a menudo  es necesaria la participación de una exposición<SUP>2</SUP>. Un ejemplo son las  variantes nulas (así llamadas porque anulan la función) en genes que codifican  enzimas glutatión-S-transferasas <I>(GSTT1, GSTM1)</I>. Los individuos fumadores  y portadores de la variante nula podrían tener un riesgo aumentado de padecer  cáncer de pulmón o de vejiga, posiblemente por ser incapaces de metabolizar los  carcinógenos del tabaco<SUP>3-5</SUP>, aunque estos hallazgos no siempre son  consistentes<SUP>6</SUP>.</FONT></P>     <P><font face="Arial"><FONT size=2>Los polimorfismos más frecuentes son  cambios de una única base. A éstos se les llama polimorfismos de un único  nucleótido (<I>single nucleotide polymorphism</I> [SNP], pronunciado «esnip»).  Por ejemplo, en el gen de la apolipoproteína E <I>(ApoE)</I> se han descrito  varios polimorfismos frecuentes que consisten en cambios de una única base. Uno  de ellos, denominado <I>ApoE</I></FONT> <FONT face=arial,helvetica  size=2>* -4, resulta en un cambio en el  aminoácido cisteína de la posición 112 por una arginina. Esta variante se asocia  con la enfermedad de Alzheimer<SUP>7</SUP>. Otros polimorfismos son  repeticiones, en un número variable de veces, de una secuencia corta  (<I>variable number tandem repeat</I> [VNTR]). Por ejemplo, los individuos  afectados por ataxia de Fredreich, una enfermedad autosómica recesiva, son  portadores de variantes en el gen <I>frataxin</I> con un número elevado  repeticiones del triplete GAA en el primer intrón. Los individuos normales  suelen tener menos de 40 repeticiones, mientras que los afectados tienen entre  100 y 1.700 repeticiones<SUP>8</SUP>. En otras ocasiones, los polimorfismos se  deben a deleciones o inserciones de secuencias cortas de nucleótidos. El cambio  de un único nucleótido, si ocurre en una zona codificante como en el ejemplo de  la <I>ApoE</I>, puede provocar un cambio de aminoácido en la proteína  resultante, y ello puede resultar en una modificación de su actividad o función.  Los cambios también pueden ocurrir en zonas del promotor de un gen y modificar  su expresión. Estas zonas promotoras modulan el proceso de transcripción del ADN  en ARN (la transcripción es el primer paso de la decodificación de un gen a una  proteína). Lo mismo puede ocurrir si el cambio se produce en un intrón, como el  ejemplo de la ataxia de Friedrich<SUP>8</SUP>. Aunque los intrones no se  traducen a proteína, cambios en su estructura pueden modular la expresión del  gen. Otras veces, probablemente la mayoría, los cambios son silentes y no tienen  repercusiones funcionales. Mientras que sólo estudios moleculares específicos  pueden poner de manifiesto si los polimorfismos son funcionales, los estudios  epidemiológicos son fundamentales para valorar si hay efectos en la salud de la  población<SUP>1,9,10</SUP>.</FONT></font></P>     <P><FONT face=Arial size=2>Cuando el objetivo de un estudio es  identificar un polimorfismo o variante en un gen que esté relacionado con una  enfermedad se pueden emplear diferentes estrategias. En primer lugar, es  importante obtener evidencia de que al menos una fracción de la enfermedad está  determinada genéticamente. Para ello son útiles los estudios de agregación  familiar, los de gemelos o los de emigrantes. En segundo lugar, hay que  identificar dónde están los genes de interés para la enfermedad. En esta fase se  realizan estudios denominados de ligamiento <I>(linkage)</I>, que emplean como  marcadores genéticos una serie de polimorfismos repartidos por todo el genoma.  En estos estudios se suelen emplear familias grandes con varios miembros  afectados y sus análisis permiten identificar zonas del genoma de interés, pero  tienen poca resolución. En esas zonas identificadas puede haber centenares de  genes interesantes y miles de polimorfismos candidatos. Para identificar con  mayor precisión los genes de interés y, dentro de esos genes, el o los  polimorfismos responsables, se emplean estudios de asociación, en los que se  compara la frecuencia relativa de las diferentes variantes de una serie de  polimorfismos entre los individuos afectados y un grupo control adecuado. Estos  estudios suelen seleccionar «genes candidatos» (aquellos cuya función puede  estar relacionada con la enfermedad de interés), y dentro de esos genes se busca  como marcadores genéticos a determinados polimorfismos, normalmente de tipo SNP,  repartidos a lo largo del gen.</FONT></P>     <P><FONT face=Arial size=2>En cuanto a la metodología de estudio, se  suelen emplear diseños epidemiológicos clásicos basados en individuos no  relacionados, como estudios de casos y controles o de cohortes. También se  pueden emplear diseños basados en familias, en los que los individuos de control  son parientes de los casos, como los diseños de casos y hermanos sanos o tríos  (caso y padres)<SUP>11-13</SUP>.</FONT></P>     <P><FONT face=Arial size=2>En esta revisión presentaremos la  estrategia habitual de análisis de estudios basados en diseños con individuos no  relacionados que incluyen información de polimorfismos. Para simplificar, en los  ejemplos trataremos el caso de polimorfismos tipo SNP con una única variante,  pero los métodos sirven para marcadores más complejos. En primer lugar  revisaremos el análisis de un único polimorfismo y, a continuación, el análisis  simultáneo de múltiples polimorfismos. Para una revisión de la nomenclatura  empleada en epidemiología genética es recomendable la introducción de  Elston<SUP>14</SUP>.</FONT></P>     <P><B><FONT face=Arial size=2>Análisis descriptivo de un  polimorfismo</FONT></B></P>     <P><FONT face=Arial size=2>Un polimorfismo se caracteriza porque  diferentes individuos presentan distintos nucleótidos o variantes en una  posición concreta del genoma, que se denomina <I>locus</I>. A cada posible  variante se le denomina alelo. Si se trata de un SNP, normalmente serán 2 los  posibles alelos en un <I>locus</I>: por ejemplo, el cambio de T por C (T &gt;  C). Si el <I>locus</I> corresponde a un cromosoma autosómico (del 1 al 22), cada  individuo es portador de 2 alelos, uno en cada copia del cromosoma, que se  heredan del padre y madre de manera independiente. La pareja de alelos observada  en un individuo se denomina genotipo y, para el <I>locus</I> T &gt; C del  ejemplo, las 3 posibilidades de parejas de alelos son: TT, TC y CC. Los  individuos con los 2 alelos idénticos, sean TT o CC, se denominan homocigotos y  los que tienen diferentes alelos (TC), heterocigotos. En general se considera  variante al alelo menos frecuente, pero esto puede diferir de una población a  otra.</FONT></P>     <P><FONT face=Arial size=2>La descripción estadística de un  polimorfismo consiste, en primer lugar, en estimar la prevalencia en la  población de cada alelo y de cada genotipo posible, lo que en nomenclatura  genética se denomina estimar las frecuencias alélicas y genotípicas,  respectivamente. En general, las técnicas de laboratorio permiten determinar el  genotipo de cada individuo. Las frecuencias genotípicas, por tanto, se estiman  directamente calculando la proporción de individuos con cada genotipo. Para  estimar las frecuencias alélicas simplemente se duplica la muestra tomando como  unidad de observación el cromosoma (cada individuo contribuye con 2 cromosomas)  y se calcula la proporción de cada alelo. Por ejemplo, si en una muestra de 200  individuos observamos los siguientes genotipos:</FONT></P>     <P align="center"><img src="/img/gs/v19n4/metodologica_archivos/metodologica_fig1.gif" width="181" height="26"></P>     ]]></body>
<body><![CDATA[<P><FONT face=Arial size=2>    <br> las frecuencias genotípicas  serán:</FONT></P>     <P align=center><img src="/img/gs/v19n4/metodologica_archivos/metodologica_fig2.gif" width="200" height="31"></P>     <P><FONT face=Arial size=2>    <br> y las frecuencias alélicas  serán:</FONT></P>     <P align=center><img src="/img/gs/v19n4/metodologica_archivos/metodologica_fig3.gif" width="350" height="26"></P>     <P><B><FONT face=Arial size=2>    <br> Equilibrio de Hardy-Weinberg</FONT></B></P>     <P><FONT face=Arial size=2>El principio de equilibrio de  Hardy-Weinberg determina qué frecuencias deben observarse en la población para  cada genotipo en función de las frecuencias de los alelos. En condiciones  habituales, si la transmisión de los alelos de los progenitores a los  descendientes es independiente y no ocurren fenómenos distorsionadores, como la  aparición frecuente de nuevas mutaciones o la selección de alelos, la  probabilidad de observar una combinación de alelos concreta (un genotipo)  depende del producto de las probabilidades (frecuencias) de cada alelo. En  nuestro ejemplo, si llamamos p a la frecuencia de T, el primer alelo, y q a la  frecuencia de C, el segundo (suponiendo que sólo hay 2 alelos posibles), las  frecuencias esperadas de cada genotipo son:</FONT></P>     <P align=center><img src="/img/gs/v19n4/metodologica_archivos/metodologica_fig4.gif" width="200" height="31"></P>     ]]></body>
<body><![CDATA[<P><FONT face=Arial size=2>    <br> donde N es el tamaño de muestra. Si en  nuestro ejemplo sustituimos p y q por los valores estimados:</FONT></P>     <P><FONT face=Arial size=2>0,74 y 0,26 respectivamente, las  frecuencias esperadas serán:</FONT></P>     <P align=center><img src="/img/gs/v19n4/metodologica_archivos/metodologica_fig5.gif" width="239" height="28"></P>     <P><FONT face=Arial size=2>Estas frecuencias esperadas se pueden comparar con las observadas utilizando el test de la &#967;<sup>2</sup> HW = &#8721; (O-E)<SUP>2</SUP>/E, con 1 grado de  libertad. Para el ejemplo HW vale 0,20, que corresponde a una p de 0,64, por lo  que es compatible con el equilibrio de Hardy-Weinberg.</FONT></P>     <P><FONT face=Arial size=2>Antes de realizar un análisis de asociación  se debe comprobar si se cumple el principio de equilibrio de Hardy-Weinberg en  la muestra de controles (como representantes de la población general). En el  caso de que se observara una desviación del equilibrio se debería revisar el  método de genotipificación, pues en ocasiones se producen sesgos al interpretar  los resultados por ser más fácil de detectar un genotipo que otros. Otras  posibilidades son que los individuos no sean independientes (p. ej., por  consanguinidad) o que se dé una selección de un alelo (p. ej., por estar  asociado con la longevidad). Tampoco debe olvidarse que si empleamos un nivel de  significación del 5%, por azar puede observarse falta de ajuste al esperado,  aunque la condición de transmisión de alelos con independencia sea correcta en  la población del estudio. En la muestra de casos es posible que no se cumpla el  equilibrio de Hardy-Weinberg; ello puede ser indicativo de que el polimorfismo  pueda estar asociado con la enfermedad.</FONT></P>     <P><B><FONT face=Arial size=2>Análisis de asociación de un  polimorfismo con la enfermedad</FONT></B></P>     <P><font face="Arial"><FONT size=2>Desde el punto de vista estadístico, un  polimorfismo constituye una variable categórica con varios genotipos posibles y  se suele considerar como categoría de referencia al grupo de individuos  homocigotos para el alelo más frecuente. Para evaluar la asociación de un  polimorfismo con la enfermedad se construye la tabla de contingencia  correspondiente y se puede contrastar la hipótesis de asociación mediante un  test de la &#967;<SUP>2</SUP>. También se pueden calcular las  <I>odds ratios</I> (OR) de cada genotipo respecto de la referencia para  cuantificar la magnitud de la asociación.</FONT></font></P>     <P><FONT face=Arial size=2>Si es necesario ajustar los análisis por  posibles variables de confusión, entonces es preferible emplear modelos de  regresión logística por su versatilidad. Además, estos modelos permiten evaluar  fácilmente si hay interacciones entre el polimorfismo y otros  factores.</FONT></P>     <P><FONT face=Arial size=2>Llamaremos ahora p a la probabilidad de ser  caso, G al polimorfismo (que codificará los diferentes genotipos: TT, TC, CC) y  Z a una o más variables por las que se desea ajustar el modelo. El modelo  logístico se define por la ecuación:</FONT></P>     ]]></body>
<body><![CDATA[<P align=center><img src="/img/gs/v19n4/metodologica_archivos/metodologica_fig6.gif" width="185" height="29"></P>     <P><FONT face=Arial size=2>donde &#945;, ß y &#947; son parámetros estimados.</FONT></P>     <P><FONT face=Arial size=2>Supongamos que el polimorfismo G es un SNP  en el que el alelo variante C modifica el riesgo de la enfermedad de interés. Ya  que cada individuo posee una pareja de alelos, el riesgo asociado con cada  genotipo puede depender del número de copias de C, lo que permite definir varios  modelos de herencia posibles cuya verosimilitud se puede explorar mediante una  adecuada codificación de los genotipos (<a href="#t1">tabla 1</a>).</FONT></P>     <P align=center><a name="t1"><img src="/img/gs/v19n4/metodologica_archivos/metodologica_tabla1.gif" width="350" height="175"></a></P>     <P><FONT face=Arial size=2>    <br>Los 4 modelos principales de herencia posibles, son:</FONT></P>     <P><I><FONT face=Arial size=2>Modelo dominante.</FONT></I> <FONT face=Arial size=2> Supone que una  única copia de C es suficiente para modificar el riesgo y que ser portador de 2  copias lo modifica en igual magnitud; es decir, heterocigotos TC y homocigotos  CC tienen el mismo riesgo. Se puede comparar la combinación de estos</FONT></P>    <P><FONT face=Arial size=2>2  genotipos respecto a los homocigotos TT:</FONT></P>     <P align=center><img src="/img/gs/v19n4/metodologica_archivos/metodologica_fig7.gif" width="190" height="28"></P>     <P><I><FONT face=Arial size=2>    ]]></body>
<body><![CDATA[<br> Modelo recesivo.</FONT></I> <FONT face=Arial size=2> Supone que son  necesarias 2 copias de C para modificar el riesgo; por tanto, heterocigotos TC y  homocigotos del alelo más frecuente TT tienen el mismo riesgo. Se compara la  combinación de ellos respecto a los homocigotos del alelo variante  CC:</FONT></P>     <P align=center><img src="/img/gs/v19n4/metodologica_archivos/metodologica_fig8.gif" width="197" height="31"></P>     <P><I><FONT face=Arial size=2>    <br> Modelo aditivo.</FONT></I> <FONT face=Arial size=2> Supone que cada  copia de C modifica el riesgo en una cantidad aditiva (en escala logit); por  tanto, los homocigotos CC tienen el doble de riesgo que los heterocigotos TC. Se  compara la combinación ponderada, donde se da peso 1 a los heterocigotos TC y  peso 2 a los homocigotos CC:</FONT></P>     <P align=center><img src="/img/gs/v19n4/metodologica_archivos/metodologica_fig9.gif" width="194" height="29"></P>     <P><I><FONT face=Arial size=2>    <br> Modelo codominante.</FONT></I> <FONT face=Arial size=2> Es el más  general. Cada genotipo proporciona un riesgo de enfermedad diferente y no  aditivo. Se comparan heterocigotos (He) y homocigotos variantes (Va) por  separado respecto a los homocigotos del alelo más frecuente. Este modelo emplea  2 coeficientes (grados de libertad).</FONT></P>     <P align=center><img src="/img/gs/v19n4/metodologica_archivos/metodologica_fig10.gif" width="250" height="27"></P>     <P><FONT face=Arial size=2>    <br> No es fácil hallar un criterio para estable  cer el modelo de herencia más adecuado para un polimorfismo concreto.  Habitualmente se suele comparar el ajuste del modelo codominante, que es el más  general (2 parámetros), con los demás modelos (1 parámetro). Estas comparaciones  pueden realizarse mediante el test de la razón de verosimilitudes. Aun así, a  menudo no es posible diferenciar entre varios modelos y se elige el que tenga  menor valor del criterio de información de Akaike (AIC = -2log[L] +  #parámetros), donde L es la verosimilitud del modelo. Este criterio pondera el  ajuste del modelo (-2logL) con la complejidad (número de parámetros). Los  resultados obtenidos al aplicar este criterio, puramente estadístico, deben  considerarse provisionales. Lo adecuado sería que obtuviesen validación en el  laboratorio y que fuesen replicados por otros estudios  epidemiológicos.</FONT></P>     ]]></body>
<body><![CDATA[<P><FONT face=Arial size=2>Los modelos de interacción añaden un  término producto entre el genotipo y una variable ambiental:</FONT></P>     <P align=center><img src="/img/gs/v19n4/metodologica_archivos/metodologica_fig11.gif" width="256" height="35"></P>     <P><FONT face=Arial size=2>    <br> También pueden incluir el producto de 2  genotipos si se exploran interacciones gen-gen:</FONT></P>     <P align=center><img src="/img/gs/v19n4/metodologica_archivos/metodologica_fig12.gif" width="335" height="32"></P>     <P><font face="Arial"><FONT size=2>    <br> A partir de los coeficientes</FONT> <FONT  face=arial,helvetica size=2>ß</FONT> <FONT face=arial,helvetica size=2>y</FONT>  <FONT face=arial,helvetica size=2>*</FONT> <FONT face=arial,helvetica size=2>de  los modelos se puede calcular las OR de asociación entre cada genotipo y la  enfermedad y los correspondientes intervalos de confianza del 95%.</FONT></font></P>     <P><FONT face=Arial size=2>Algunos investigadores analizan el riesgo  comparando la distribución de alelos entre casos y controles. Para ello, cada  individuo contribuye con 2 observaciones en la muestra, una por cada cromosoma,  y se compara el riesgo del alelo variante respecto al más frecuente. Este  análisis sólo es correcto en el caso de que la distribución de los alelos sea  independiente en la población (equilibrio de Hardy-Weinberg en controles). El  análisis equivalente que es correcto en cualquier ocasión es el modelo aditivo  de genotipos<SUP>15,16</SUP>.</FONT></P>     <P><B><FONT face=Arial size=2>Ejemplo de análisis</FONT></B></P>     <P><FONT face=Arial size=2>Supongamos que se ha realizado un estudio  de casos y controles en el que se evalúa si un polimorfismo en un gen  relacionado con la reparación del ADN modifica el riesgo de padecer cáncer  colorrectal. En la <a href="#t2"> tabla 2</a> se presentan los 4 modelos principales de riesgo  posibles. El modelo codominante muestra que sólo los individuos CC tienen un  riesgo aumentado. Los heterocigotos TC tienen un riesgo similar a los  homocigotos TT, lo que sugiere que el modelo recesivo es el adecuado.</FONT></P>     ]]></body>
<body><![CDATA[<P align=center><a name="t2"><img src="/img/gs/v19n4/metodologica_archivos/metodologica_tabla2.gif" width="649" height="280"></a></P>     <P><B><FONT face=Arial size=2>    <br> Análisis simultáneo de múltiples  <I>loci</I></FONT></B></P>     <P><FONT face=Arial size=2>Con frecuencia son varios los polimorfismos  que se analizan simultáneamente en un gen o región candidata de un gen. El  motivo es que el polimorfismo realmente responsable de influir o modificar el  riesgo de la enfermedad puede ser desconocido; por ello se analizan varios  polimorfismos para intentar identificarlo. Entre diferentes polimorfismos  localizados en el mismo cromosoma y relativamente próximos entre sí suele  observarse cierto grado de correlación o asociación estadística denominada  desequilibrio de ligamiento <I>(linkage disequilibrium)</I>. Ello es debido a  que en el proceso de meiosis que genera los gametos, los cromosomas que se  transmitirán serán copias exactas de los del progenitor, a excepción de los  entrecruzamientos que generan recombinación. Es decir, cada cromosoma  transmitido a la descendencia estará formado por una composición de fragmentos  largos que son una copia exacta de los del progenitor, pero combinando partes  del cromosoma paterno y del materno. La frecuencia de entrecruzamientos por  cromosoma es pequeña, de 1 a 4, y depende de su tamaño. La probabilidad de que  entre 2 <I>loci</I> cercanos se dé una recombinación es baja y, por ello, se  observa el desequilibrio de ligamiento, que tiende a disminuir en sucesivas  generaciones hasta llegar al equilibrio (independencia estadística).</FONT></P>     <P><FONT face=Arial size=2>El desequilibrio de ligamiento es muy útil,  pues permite localizar polimorfismos relacionados con la enfermedad. Si aparece  una mutación que genera un polimorfismo responsable de la enfermedad, es posible  que otros polimorfismos cercanos también estén asociados con ella. De hecho,  como lo que se transmite de padres y madres a sus hijos son cromosomas, suele  ser interesante identificar el conjunto de alelos que se transmiten  conjuntamente en cada cromosoma, de manera que sea más fácil así identificar el  polimorfismo causal. A este conjunto de alelos que se transmiten conjuntamente  se le denomina haplotipo. Un individuo, para un conjunto de <I>loci</I>  cercanos, posee 2 haplotipos, cada uno en un cromosoma. Identificar los  haplotipos a partir de los genotipos de cada <I>locus</I> suele ser fácil,  aunque hay algunos casos excepcionales. En la <a href="#t3"> tabla 3</a> se presentan los  haplotipos para el caso de 2 <I>loci</I> bialélicos, es decir, 2 polimorfismos  cercanos, cada uno de ellos con 2 alelos posibles, el primero T &gt; C y el  segundo A &gt; G. De las 9 combinaciones de genotipos posibles, todas ellas  permiten identificar los haplotipos a excepción de una, que corresponde al caso  en que ambos <I>loci</I> sean heterocigotos. Por ejemplo, si los genotipos para  un individuo son TC y AA, sus haplotipos serán T-A y C-A, es decir, el individuo  será portador de una pareja de cromosomas, con cada una de estas combinaciones  de alelos. En el caso de que los 2 genotipos sean heterocigotos: TC y AG, la  combinación de alelos en cromosomas puede ser T-A y C-G o bien T-G y C-A. No se  puede saber qué combinación es la correcta para un individuo si no se conocen  los genotipos de los progenitores o se emplean técnicas de laboratorio muy  sofisticadas que permitan identificar haplotipos. En la práctica, para realizar  análisis estadísticos de asociación se recurre a métodos de estimación que  tienen en cuenta variables con incertidumbre para resolver este  problema.</FONT></P>     <P align=center><a name="t3"><img src="/img/gs/v19n4/metodologica_archivos/metodologica_tabla3.gif" width="315" height="188"></a></P>     <P><B><FONT face=Arial size=2>    <br> Análisis descriptivo de  haplotipos</FONT></B></P>     <P><FONT face=Arial size=2>La estimación de las frecuencias para cada  haplotipo sería sencilla si no se dieran casos de incertidumbre, es decir, casos  en que no es posible determinar la pareja de haplotipos que lleva el individuo  debido a que éste tenga 2 o más <I>loci</I> heterocigotos. Si, además, hay  valores perdidos en la determinación de alguno de los genotipos, la  incertidumbre aumenta. Para estimar la frecuencia de los haplotipos en estos  casos hay varias posibilidades:</FONT></P>     <P><I><FONT face=Arial size=2>1.</FONT></I> <FONT face=Arial size=2> Métodos basados en reglas.  Consisten en observar la distribución de alelos en los haplotipos que no  presentan incertidumbre e imputar los casos con incertidumbre a aquellas  combinaciones observadas con más frecuencia<SUP>17</SUP>. El principal  inconveniente de este método es que la solución puede no ser única en función de  cómo se inicie el algoritmo.</FONT></P>     ]]></body>
<body><![CDATA[<P><I><FONT face=Arial size=2>2.</FONT></I> <FONT face=Arial size=2> Estimación estadística mediante  el algoritmo esperanza-maximización<SUP>18</SUP> (EM). Éste es un método  estadístico genérico<SUP>19</SUP> para tratar variables no observadas (en este  caso, la proporción de individuos con cada posible haplotipo en caso de  incertidumbre). El algoritmo itera repetidamente entre 2 pasos hasta conseguir  convergencia. En primer lugar, se usan unas frecuencias iniciales, no  necesariamente correctas, para cada posible haplotipo. En el supuesto de que  esas frecuencias fuesen correctas, y asumiendo que hay equilibrio de  Hardy-Weinberg, se podría calcular la frecuencia esperada de cada combinación de  genotipos con incertidumbre (paso E). Con las frecuencias de cada combinación de  genotipos se pueden obtener las frecuencias de cada haplotipo maximizando la  función de verosimilitud de los haplotipos (paso M). Este paso consiste en  contar los haplotipos compatibles con cada combinación de genotipos. El  algoritmo converge a valores estables de frecuencia de combinaciones de  genotipos con incertidumbre y de frecuencia de haplotipos, que es nuestro  objetivo. Para los individuos con incertidumbre, a cada pareja de haplotipos  posible se le puede calcular una probabilidad. Una limitación de este método es  que no proporciona directamente varianzas de las estimaciones y, si se analizan  simultáneamente muchos polimorfismos (más de 20) con un alto grado de  incertidumbre, pueden obtenerse soluciones incorrectas, pues el algoritmo puede  tender hacia un máximo local. En estas situaciones es importante repetir el  algoritmo empleando diferentes valores iniciales de las frecuencias de  haplotipos. En nuestra experiencia, para el análisis simultáneo de menos de 10  polimorfismos este método siempre ha proporcionado soluciones  coherentes.</FONT></P>     <P><I><FONT face=Arial size=2>3.</FONT></I> <FONT face=Arial size=2> Estimación estadística mediante  métodos Montecarlo basados en cadenas de Markov (MCMC). Se trata de una  aproximación bayesiana al problema que ha permitido mejorar los resultados en  caso de analizar muchos polimorfismos<SUP>20</SUP>. Este método proporciona como  información adicional interesante una muestra aleatoria de la distribución a  posteriori de la frecuencia de cada haplotipo, que puede ser empleada para  calcular la varianza, además del valor esperado. De esta manera podemos conocer  directamente la precisión de la estimación de la frecuencia de cada haplotipo.</FONT></P>     <P><B><FONT face=Arial size=2>Análisis de la asociación de los  haplotipos con la enfermedad</FONT></B></P>     <P><FONT face=Arial size=2>Cualquiera de los métodos anteriores  permite identificar o estimar, para cada individuo, la pareja de haplotipos que  posee en función de los genotipos. Estos haplotipos pueden analizarse entonces  en relación con la enfermedad mediante modelos de regresión logística.  Normalmente se realiza un análisis de cromosomas y no de individuos, es decir,  se duplica la muestra, de manera que cada individuo contribuye con 2  observaciones, una para cada haplotipo, y se compara el riesgo asociado con los  diversos haplotipos entre sí, tomando como referencia el más frecuente. Este  análisis es más sencillo de analizar e interpretar que el de parejas de  haplotipos y no parece que requiera la realización ajustes, pues los haplotipos  se heredan de manera independiente; no obstante, este aspecto no está  completamente estudiado.</FONT></P>     <P><FONT face=Arial size=2>En caso de incertidumbre por múltiples  heterocigotos o valores perdidos, los métodos basados en el algoritmo EM o MCMC  proporcionan una lista de parejas de haplotipos compatibles, cada una con una  probabilidad de aparición asociada. Entonces, estos individuos contribuyen en  los datos con más de 2 observaciones y se emplean las probabilidades de  aparición de cada haplotipo como pesos en el modelo de regresión logística. El  análisis combinado de genotipos y haplotipos suele ser más informativo que  cualquiera de los </FONT><FONT face=Arial size=2>2 aislados, aunque hay cierta discusión sobre qué análisis  es preferible en cada situación<SUP>21,22</SUP>.</FONT></P>     <P><B><FONT face=Arial size=2>Ejemplo de análisis de genotipos y  haplotipos</FONT></B></P>     <P><FONT face=Arial size=2>Supongamos un estudio de casos y controles  sobre cáncer colorrectal en que se analizan 4 polimorfismos en un gen  relacionado con el metabolismo de carcinógenos. En la <a href="#t4"> tabla 4</a> se muestra el  análisis de cada polimorfismo por separado para el modelo codominante. Los  polimorfismos en los <I>loci</I> A y B son raros y sólo se ha observado un caso  homocigoto variante para cada uno de ellos, por lo que se analizan con el modelo  dominante. El polimorfismo C muestra una asociación fuerte con la enfermedad y  las OR crecientes indican que el modelo aditivo es el que mejor ajusta. El  polimorfismo D también está asociado con la enfermedad, pero en menor magnitud,  y como los OR para heterocigotos y homocigotos variantes son similares, el  modelo dominante es el más verosímil.</FONT></P>     <P align=center><a name="t4"><img src="/img/gs/v19n4/metodologica_archivos/metodologica_tabla4.gif" width="640" height="313"></a></P>     <P><FONT face=Arial size=2>    <br> El análisis de haplotipos que se muestra en  la <a href="#t5"> tabla 5</a> revela que, aunque podría haber 2<SUP>4</SUP> = 16 combinaciones de  alelos diferentes, sólo se observan 7. De hecho, 2 haplotipos acumulan una  frecuencia del 92%. En los análisis de asociación, los haplotipos raros  normalmente se agrupan en una categoría. El punto de corte para definir un  haplotipo raro suele depender del tamaño de muestra global. En nuestro caso, con  unos 700 individuos limitaremos el análisis a los 5 haplotipos con frecuencia  superior al 1%.</FONT></P>     ]]></body>
<body><![CDATA[<P align=center><a name="t5"><img src="/img/gs/v19n4/metodologica_archivos/metodologica_tabla5.gif" width="314" height="213"></a></P>     <P><FONT face=Arial size=2>    <br> El haplotipo 1, el más frecuente, se toma  como referencia. El segundo haplotipo en frecuencia contiene variantes para los  polimorfismos C y D, simultáneamente. La correlación (desequilibrio de  ligamiento) entre estos 2 polimorfismos es muy alta. Este haplotipo es el único  que muestra un riesgo aumentado significativo y recoge la información observada  en el análisis de genotipos por separado. Sin embargo, el haplotipo 3, con una  frecuencia del 4%, sólo difiere del más frecuente por la variante en el  polimorfismo D, y este haplotipo muestra una asociación inversa, no  significativa, con la enfermedad. Ello permite deducir que el aumento de riesgo  observado en el análisis del polimorfismo D es espúreo, reflejo de la  correlación (desequilibrio de ligamiento) con el polimorfismo C. Se trata de un  fenómeno similar al de la confusión en otros contextos de análisis  epidemiológico. Otra manera de confirmar esta observación es realizar un  análisis de los genotipos del polimorfismo D ajustado por el C. La asociación  desaparece (OR modelo dominante = 0,99; IC del 95%, 0,55-1,77; p = 0,99),  mientras que el análisis del polimorfismo C ajustado por el D mantiene los  estimadores y la significación estadística. En este ejemplo, los polimorfismos A  y B son poco frecuentes y apenas aportan información.</FONT></P>     <P><FONT face=Arial size=2>El hecho de que el polimorfismo C domine la  asociación no permite concluir que es el realmente causante de modificar el  riesgo de la enfermedad. Para ello sería necesario contar con información de  estudios funcionales que demostraran un efecto biológico diferente en la  variante en comparación con el alelo más frecuente. La asociación observada  podría ser debida a otro polimorfismo no estudiado cercano al C que estuviese  altamente correlacionado. Es evidente que si no contáramos con la información  del polimorfismo C y tuviésemos sólo la del D podríamos caer en la tentación de  imputar el efecto a D, algo que ahora sabemos que es falso.</FONT></P>     <P><B><FONT face=Arial size=2>Software para análisis de genotipos y  haplotipos</FONT></B></P>     <P><FONT face=Arial size=2>Los análisis de este trabajo se han  realizado con el paquete <I>haplo.Stats</I><SUP>23</SUP> del software de uso  libre <I>R</I><SUP>24</SUP>. La función haplo.em permite estimar las frecuencias  de haplotipos mediante el algoritmo EM. La función haplo.glm permite ajustar  modelos de regresión logística empleando las probabilidades de cada pareja de  haplotipos con incertidumbre como pesos en el modelo. En R hay otros paquetes  útiles para análisis de epidemiología genética (genetics, hapassoc y gap) y casi  todos emplean una adaptación del programa SNPHAP de Clayton<SUP>25</SUP>. Otros  programas útiles de uso libre son Arlequin<SUP>26</SUP>, Haploview<SUP>27</SUP>  y EH<SUP>28</SUP> y se puede encontrar un listado exhaustivo de software para  análisis genéticos en la Universidad Rockefeller<SUP>29</SUP>.</FONT></P> <hr color="#000000" width="30%" align="left">     <P><B><FONT face=Arial size=2>Agradecimientos</FONT></B></P>     <P><FONT face=Arial size=2>Este trabajo ha recibido financiación del  FIS (expedientes 96/0797, 03/0114) y del ISCIII (redes de centros C03/09 y  C03/10).    <br> </FONT></P>     <P><font face="Arial" size="2"><b>Bibliografía</b></font></P>    ]]></body>
<body><![CDATA[<!-- ref --><P><FONT face=Arial  size=2>1. Guttmacher AE, Collins FS. Genomic medicine-a primer. N Engl J  Med. 2002;347:1512-20.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357365&pid=S0213-9111200500040001100001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>2. Porta M. The genome sequence is a jazz score. Int J  Epidemiol. 2003;32:29-31.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357366&pid=S0213-9111200500040001100002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>3. McWilliams JE, Sanderson BJ, Harris EL,  Richert-Boe KE, Henner WD. Glutathione S-transferase M1 (GSTM1) deficiency and  lung cancer risk. Cancer Epidemiol Biomarkers Prev. 1995; 4:589-94.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357367&pid=S0213-9111200500040001100003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>4.  Sorensen M, Autrup H, Tjonneland A, Overvad K, Raaschou-Nielsen O. Glutathione  S-transferase T1 null-genotype is associated with an increased risk of lung  cancer. Int J Cancer. 2004;110:219-24.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357368&pid=S0213-9111200500040001100004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>5. Hung RJ, Boffetta P, Brennan P, et  al. GST, NAT, SULT1A1, CYP1B1 genetic polymorphisms, interactions with  environmental exposures and bladder cancer risk in a high-risk population. Int J  Cancer. 2004;110:598-604.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357369&pid=S0213-9111200500040001100005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>6. Benhamou S, Lee WJ, Alexandrie AK, Boffeta P,  Bonchardy C, Butkiewicz P, et al. Meta- and pooled analyses of the effects of  glutathione S-transferase M1 polymorphisms and smoking on lung cancer risk.  Carcinogenesis. 2002;23:1343-50.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357370&pid=S0213-9111200500040001100006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>7. Strittmatter WJ, Weisgraber KH, Huang DY,  Dang LM, Salvesen GS, Pericak-Yance, et al. Binding of human apolipoprotein E to  synthetic amyloid beta peptide: isoform-specific effects and implications for  late-onset Alzheimer disease. Proc Natl Acad Sci USA. 1993;90:8098-102.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357371&pid=S0213-9111200500040001100007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>8.  Pandolfo M. Friedreich's ataxia: clinical aspects and pathogenesis. Semin  Neurol. 1999;19:311-21.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357372&pid=S0213-9111200500040001100008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>9. Caporaso NE. Why have we failed to find the low  penetrance genetic constituents of common cancers? Cancer Epidemiol Biomarkers  Prev. 2002;11:1544-9.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357373&pid=S0213-9111200500040001100009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>10. Tabor HK, Risch NJ, Myers RM. Opinion:  candidate-gene approaches for studying complex genetic traits: practical  considerations. Nat Rev Genet. 2002;3:391-7.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357374&pid=S0213-9111200500040001100010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>11. Cardon LR, Bell JI.  Association study designs for complex diseases. Nat Rev Genet.  2001;2:91-9.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357375&pid=S0213-9111200500040001100011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>12. Zhao H. Family-based association studies. Stat Methods Med  Res. 2000;9:563-87.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357376&pid=S0213-9111200500040001100012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>13. Gauderman WJ, Witte JS, Thomas DC. Family-based  association studies. J Natl Cancer Inst Monogr. 1999;26:31-7.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357377&pid=S0213-9111200500040001100013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>14. Elston RC.  Introduction and overview. Statistical methods in genetic epidemiology. Stat  Methods Med Res. 2000;9:527-41.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357378&pid=S0213-9111200500040001100014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>15. Schaid DJ. Disease-marker association.  En: Elston RC, Olson JM, Palmer L, editors. Biostatistical genetics and genetic  epidemiology Chichester: Wiley; 2002. p. 206-17.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357379&pid=S0213-9111200500040001100015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>16. Clayton D. Population  association. En: Balding DJ, Bishop M, Cannings C, editors. Handbook of  statistical genetics. Chichester: Wiley; 2001. p. 519-40.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357380&pid=S0213-9111200500040001100016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>17. Clark AG.  Inference of haplotypes from PCR-amplified samples of diploid populations. Mol  Biol Evol. 1990;7:111-22.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357381&pid=S0213-9111200500040001100017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>18. Excoffier L, Slatkin M. Maximum-likelihood  estimation of molecular haplotype frequencies in a diploid population. Mol Biol  Evol. 1995;12:921-7.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357382&pid=S0213-9111200500040001100018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>19. Dempster AP, Laird NM, Rubin DB. Maximum likelihood  from incomplete data via the EM algorithm. J R Stat Soc Ser B.  1997;39:1-38.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357383&pid=S0213-9111200500040001100019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>20. Stephens M, Smith NJ, Donnelly P. A new statistical method  for haplotype reconstruction from population data. Am J Hum Genet.  2001;68:978-89.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357384&pid=S0213-9111200500040001100020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>21. Clayton D, Chapman J, Cooper J. Use of unphased  multilocus genotype data in indirect association studies. Genet Epidemiol.  2004;27:415-28.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357385&pid=S0213-9111200500040001100021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>22. Cordell HJ, Clayton DG. A unified stepwise regression  procedure for evaluating the relative effects of polymorphisms within a gene  using case/control or family data: application to HLA in type 1 diabetes. Am J  Hum Genet. 2002;70:124-41.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357386&pid=S0213-9111200500040001100022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>23. Lake SL, Lyon H, Tantisira K, et al.  Estimation and tests of haplotype-environment interaction when linkage phase is  ambiguous. Hum Hered. 2003;55:56-65.</FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357387&pid=S0213-9111200500040001100023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>24. The R Project (Consultado 5 Ene 2005). Disponible en: <a href="http://www.r-project.org" target="_blank">http://www.r-project.org</a></FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357388&pid=S0213-9111200500040001100024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>25. SNPHAP. A program for  estimating frequencies of large haplotypes of SNPs. Cambridge: Department of  Medical Genetics, Cambridge Institute for Medical Research (Consultado 5 Ene 2005). Disponible en: <a href="http://www-gene.cimr.cam.ac.%20uk/clayton/software/snphap.txt" target="_blank">http://www-gene.cimr.cam.ac. uk/clayton/software/snphap.txt</a></FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357389&pid=S0213-9111200500040001100025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>26. Schneider S, Roessli D, Excoffier L.  Arlequin: a software for population genetics data analysis. Ver 2.000. Geneva:  Genetics and Biometry Lab, Department of Anthropology, University of Geneva (Consultado 5 Ene 2005). Disponible en: <a href="http://lgb.unige.ch/arlequin/" target="_blank">http://lgb.unige.ch/arlequin/</a></FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357390&pid=S0213-9111200500040001100026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>27.  Barrett JC, Fry B, Maller J, Daly MJ. Haploview: analysis and visualization of  LD and haplotype maps. (Consultado 5 Ene 2005). Disponible en: <a href="http://www.broad.mit.edu/personal/jcbarret/haploview/" target="_blank">http://www.broad.mit.edu/personal/jcbarret/haploview/</a></FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357391&pid=S0213-9111200500040001100027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>28. EH linkage analysis  software. New York: Rockefeller University (Consultado 5 Ene 2005). Disponible  en: <a href="http://linkage.rockefeller.edu/ott/eh.htm" target="_blank">http://linkage.rockefeller.edu/ott/eh.htm</a></FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357392&pid=S0213-9111200500040001100028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><P><FONT face=Arial  size=2>29. An alphabetic list of  genetic analysis software. New York: Rockefeller University (Consultado 30 Sep 2004). Disponible en: <a href="http://linkage.rockefeller.edu/soft" target="_blank">http://linkage.rockefeller.edu/soft</a></FONT>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2357393&pid=S0213-9111200500040001100029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Guttmacher]]></surname>
<given-names><![CDATA[AE]]></given-names>
</name>
<name>
<surname><![CDATA[Collins]]></surname>
<given-names><![CDATA[FS]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Genomic medicine: a primer]]></article-title>
<source><![CDATA[N Engl J Med]]></source>
<year>2002</year>
<volume>347</volume>
<page-range>1512-20</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Porta]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The genome sequence is a jazz score]]></article-title>
<source><![CDATA[Int J Epidemiol]]></source>
<year>2003</year>
<volume>32</volume>
<page-range>29-31</page-range></nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McWilliams]]></surname>
<given-names><![CDATA[JE]]></given-names>
</name>
<name>
<surname><![CDATA[Sanderson]]></surname>
<given-names><![CDATA[BJ]]></given-names>
</name>
<name>
<surname><![CDATA[Harris]]></surname>
<given-names><![CDATA[EL]]></given-names>
</name>
<name>
<surname><![CDATA[Richert-Boe]]></surname>
<given-names><![CDATA[KE]]></given-names>
</name>
<name>
<surname><![CDATA[Henner]]></surname>
<given-names><![CDATA[WD]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Glutathione S-transferase M1 (GSTM1) deficiency and lung cancer risk]]></article-title>
<source><![CDATA[Cancer Epidemiol Biomarkers Prev]]></source>
<year>1995</year>
<volume>4</volume>
<page-range>589-94</page-range></nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sorensen]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Autrup]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Tjonneland]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Overvad]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Raaschou-Nielsen]]></surname>
<given-names><![CDATA[O]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Glutathione S-transferase T1 null-genotype is associated with an increased risk of lung cancer]]></article-title>
<source><![CDATA[Int J Cancer]]></source>
<year>2004</year>
<volume>110</volume>
<page-range>219-24</page-range></nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hung]]></surname>
<given-names><![CDATA[RJ]]></given-names>
</name>
<name>
<surname><![CDATA[Boffetta]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Brennan]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[GST, NAT, SULT1A1, CYP1B1 genetic polymorphisms, interactions with environmental exposures and bladder cancer risk in a high-risk population]]></article-title>
<source><![CDATA[Int J Cancer]]></source>
<year>2004</year>
<volume>110</volume>
<page-range>598-604</page-range></nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Benhamou]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Lee]]></surname>
<given-names><![CDATA[WJ]]></given-names>
</name>
<name>
<surname><![CDATA[Alexandrie]]></surname>
<given-names><![CDATA[AK]]></given-names>
</name>
<name>
<surname><![CDATA[Boffeta]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Bonchardy]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Butkiewicz]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Meta- and pooled analyses of the effects of glutathione S-transferase M1 polymorphisms and smoking on lung cancer risk]]></article-title>
<source><![CDATA[Carcinogenesis]]></source>
<year>2002</year>
<volume>23</volume>
<page-range>1343-50</page-range></nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Strittmatter]]></surname>
<given-names><![CDATA[WJ]]></given-names>
</name>
<name>
<surname><![CDATA[Weisgraber]]></surname>
<given-names><![CDATA[KH]]></given-names>
</name>
<name>
<surname><![CDATA[Huang]]></surname>
<given-names><![CDATA[DY]]></given-names>
</name>
<name>
<surname><![CDATA[Dang]]></surname>
<given-names><![CDATA[LM]]></given-names>
</name>
<name>
<surname><![CDATA[Salvesen]]></surname>
<given-names><![CDATA[GS]]></given-names>
</name>
<name>
<surname><![CDATA[Pericak-Yance]]></surname>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Binding of human apolipoprotein E to synthetic amyloid beta peptide: isoform-specific effects and implications for late-onset Alzheimer disease]]></article-title>
<source><![CDATA[Proc Natl Acad Sci USA]]></source>
<year>1993</year>
<volume>90</volume>
<page-range>8098-102</page-range></nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pandolfo]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Friedreich's ataxia: clinical aspects and pathogenesis]]></article-title>
<source><![CDATA[Semin Neurol]]></source>
<year>1999</year>
<volume>19</volume>
<page-range>311-21</page-range></nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Caporaso]]></surname>
<given-names><![CDATA[NE]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Why have we failed to find the low penetrance genetic constituents of common cancers?]]></article-title>
<source><![CDATA[Cancer Epidemiol Biomarkers Prev]]></source>
<year>2002</year>
<volume>11</volume>
<page-range>1544-9</page-range></nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tabor]]></surname>
<given-names><![CDATA[HK]]></given-names>
</name>
<name>
<surname><![CDATA[Risch]]></surname>
<given-names><![CDATA[NJ]]></given-names>
</name>
<name>
<surname><![CDATA[Myers]]></surname>
<given-names><![CDATA[RM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Opinion: candidate-gene approaches for studying complex genetic traits: practical considerations]]></article-title>
<source><![CDATA[Nat Rev Genet]]></source>
<year>2002</year>
<volume>3</volume>
<page-range>391-7</page-range></nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cardon]]></surname>
<given-names><![CDATA[LR]]></given-names>
</name>
<name>
<surname><![CDATA[Bell]]></surname>
<given-names><![CDATA[JI]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Association study designs for complex diseases]]></article-title>
<source><![CDATA[Nat Rev Genet]]></source>
<year>2001</year>
<volume>2</volume>
<page-range>91-9</page-range></nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zhao]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Family-based association studies]]></article-title>
<source><![CDATA[Stat Methods Med Res]]></source>
<year>2000</year>
<volume>9</volume>
<page-range>563-87</page-range></nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gauderman]]></surname>
<given-names><![CDATA[WJ]]></given-names>
</name>
<name>
<surname><![CDATA[Witte]]></surname>
<given-names><![CDATA[JS]]></given-names>
</name>
<name>
<surname><![CDATA[Thomas]]></surname>
<given-names><![CDATA[DC]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Family-based association studies]]></article-title>
<source><![CDATA[J Natl Cancer Inst Monogr]]></source>
<year>1999</year>
<volume>26</volume>
<page-range>31-7</page-range></nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Elston]]></surname>
<given-names><![CDATA[RC]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Introduction and overview: Statistical methods in genetic epidemiology]]></article-title>
<source><![CDATA[Stat Methods Med Res]]></source>
<year>2000</year>
<volume>9</volume>
<page-range>527-41</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Schaid]]></surname>
<given-names><![CDATA[DJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Disease-marker association]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Elston]]></surname>
<given-names><![CDATA[RC]]></given-names>
</name>
<name>
<surname><![CDATA[Olson]]></surname>
<given-names><![CDATA[JM]]></given-names>
</name>
<name>
<surname><![CDATA[Palmer]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<source><![CDATA[Biostatistical genetics and genetic epidemiology]]></source>
<year>2002</year>
<page-range>206-17</page-range><publisher-loc><![CDATA[Chichester ]]></publisher-loc>
<publisher-name><![CDATA[Wiley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Clayton]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Population association]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Balding]]></surname>
<given-names><![CDATA[DJ]]></given-names>
</name>
<name>
<surname><![CDATA[Bishop]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Cannings]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<source><![CDATA[Handbook of statistical genetics]]></source>
<year>2001</year>
<page-range>519-40</page-range><publisher-loc><![CDATA[Chichester ]]></publisher-loc>
<publisher-name><![CDATA[Wiley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Clark]]></surname>
<given-names><![CDATA[AG]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Inference of haplotypes from PCR-amplified samples of diploid populations]]></article-title>
<source><![CDATA[Mol Biol Evol]]></source>
<year>1990</year>
<volume>7</volume>
<page-range>111-22</page-range></nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Excoffier]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Slatkin]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Maximum-likelihood estimation of molecular haplotype frequencies in a diploid population]]></article-title>
<source><![CDATA[Mol Biol Evol]]></source>
<year>1995</year>
<volume>12</volume>
<page-range>921-7</page-range></nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Dempster]]></surname>
<given-names><![CDATA[AP]]></given-names>
</name>
<name>
<surname><![CDATA[Laird]]></surname>
<given-names><![CDATA[NM]]></given-names>
</name>
<name>
<surname><![CDATA[Rubin]]></surname>
<given-names><![CDATA[DB]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Maximum likelihood from incomplete data via the EM algorithm]]></article-title>
<source><![CDATA[J R Stat Soc Ser B]]></source>
<year>1997</year>
<volume>39</volume>
<page-range>1-38</page-range></nlm-citation>
</ref>
<ref id="B20">
<label>20</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Stephens]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Smith]]></surname>
<given-names><![CDATA[NJ]]></given-names>
</name>
<name>
<surname><![CDATA[Donnelly]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A new statistical method for haplotype reconstruction from population data]]></article-title>
<source><![CDATA[Am J Hum Genet]]></source>
<year>2001</year>
<volume>68</volume>
<page-range>978-89</page-range></nlm-citation>
</ref>
<ref id="B21">
<label>21</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Clayton]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Chapman]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Cooper]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Use of unphased multilocus genotype data in indirect association studies]]></article-title>
<source><![CDATA[Genet Epidemiol]]></source>
<year>2004</year>
<volume>27</volume>
<page-range>415-28</page-range></nlm-citation>
</ref>
<ref id="B22">
<label>22</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cordell]]></surname>
<given-names><![CDATA[HJ]]></given-names>
</name>
<name>
<surname><![CDATA[Clayton]]></surname>
<given-names><![CDATA[DG]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A unified stepwise regression procedure for evaluating the relative effects of polymorphisms within a gene using case/control or family data: application to HLA in type 1 diabetes]]></article-title>
<source><![CDATA[Am J Hum Genet]]></source>
<year>2002</year>
<volume>70</volume>
<page-range>124-41</page-range></nlm-citation>
</ref>
<ref id="B23">
<label>23</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lake]]></surname>
<given-names><![CDATA[SL]]></given-names>
</name>
<name>
<surname><![CDATA[Lyon]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Tantisira]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Estimation and tests of haplotype-environment interaction when linkage phase is ambiguous]]></article-title>
<source><![CDATA[Hum Hered]]></source>
<year>2003</year>
<volume>55</volume>
<page-range>56-65</page-range></nlm-citation>
</ref>
<ref id="B24">
<label>24</label><nlm-citation citation-type="">
<source><![CDATA[The R Project]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B25">
<label>25</label><nlm-citation citation-type="book">
<collab>SNPHAP</collab>
<source><![CDATA[A program for estimating frequencies of large haplotypes of SNPs]]></source>
<year></year>
<publisher-loc><![CDATA[Cambridge ]]></publisher-loc>
<publisher-name><![CDATA[Department of Medical Genetics, Cambridge Institute for Medical Research]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B26">
<label>26</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Schneider]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Roessli]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Excoffier]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<source><![CDATA[Arlequin: a software for population genetics data analysis. Ver 2.000]]></source>
<year></year>
<publisher-loc><![CDATA[Geneva ]]></publisher-loc>
<publisher-name><![CDATA[Genetics and Biometry LabDepartment of Anthropology, University of Geneva]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B27">
<label>27</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Barrett]]></surname>
<given-names><![CDATA[JC]]></given-names>
</name>
<name>
<surname><![CDATA[Fry]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Maller]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Daly]]></surname>
<given-names><![CDATA[MJ]]></given-names>
</name>
</person-group>
<source><![CDATA[Haploview: analysis and visualization of LD and haplotype maps]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B28">
<label>28</label><nlm-citation citation-type="book">
<source><![CDATA[EH linkage analysis software]]></source>
<year></year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Rockefeller University]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B29">
<label>29</label><nlm-citation citation-type="book">
<source><![CDATA[An alphabetic list of genetic analysis software]]></source>
<year></year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Rockefeller University]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
