<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0213-9111</journal-id>
<journal-title><![CDATA[Gaceta Sanitaria]]></journal-title>
<abbrev-journal-title><![CDATA[Gac Sanit]]></abbrev-journal-title>
<issn>0213-9111</issn>
<publisher>
<publisher-name><![CDATA[Sociedad Española de Salud Pública y Administración Sanitaria (SESPAS)]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0213-91112016000100014</article-id>
<article-id pub-id-type="doi">10.1016/j.gaceta.2015.09.007</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Peligros del uso de los big data en la investigación en salud pública y en epidemiología]]></article-title>
<article-title xml:lang="es"><![CDATA[Risks of the use of big data in research in public health and epidemiology]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Pérez]]></surname>
<given-names><![CDATA[Glòria]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Agència de Salut Pública de Barcelona  ]]></institution>
<addr-line><![CDATA[Barcelona ]]></addr-line>
<country>España</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>02</month>
<year>2016</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>02</month>
<year>2016</year>
</pub-date>
<volume>30</volume>
<numero>1</numero>
<fpage>66</fpage>
<lpage>68</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.isciii.es/scielo.php?script=sci_arttext&amp;pid=S0213-91112016000100014&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.isciii.es/scielo.php?script=sci_abstract&amp;pid=S0213-91112016000100014&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.isciii.es/scielo.php?script=sci_pdf&amp;pid=S0213-91112016000100014&amp;lng=en&amp;nrm=iso"></self-uri></article-meta>
</front><body><![CDATA[  <a name="top"></a>     <p><font face="Verdana" size="2"><b>DEBATE</b></font></p>     <p>&nbsp;</p>     <p><font face="Verdana" size="4"><b>Peligros del uso de los <i>big data</i> en la investigaci&oacute;n en salud p&uacute;blica y en epidemiolog&iacute;a</b></font></p>     <p><font face="Verdana" size="4"><b>Risks of the use of big data in research in public health and epidemiology</b></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <p><font face="Verdana" size="2"><b>Gl&ograve;ria P&eacute;rez</b></font></p>     <p><font face="Verdana" size="2">Ag&egrave;ncia de Salut P&uacute;blica de Barcelona, Barcelona, Espa&ntilde;a</font></p>     <p><font face="Verdana" size="2"><a href="#bajo">Dirección para correspondencia</a></font></p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p>&nbsp;</p>     <p><font face="Verdana" size="2"><i>Even John Snow needed to start with a plausible hypothesis to know where to look and choose what data to examine</i><sup>1</sup>.</font></p>     <p><font face="Verdana" size="2">La realidad incuestionable es la aparici&oacute;n de los <i>big data</i> (datos masivos). Este t&eacute;rmino se refiere a los grandes vol&uacute;menes de informaci&oacute;n compleja y conectable que crece continuamente, de modo que la informaci&oacute;n parece duplicarse cada 2 a&ntilde;os, y este fen&oacute;meno podr&iacute;a estarse acelerando. En este sentido, cabe destacar que mucha de esta informaci&oacute;n era inaccesible hace solo una d&eacute;cada.</font></p>     <p><font face="Verdana" size="2">Los datos masivos proceden de m&uacute;ltiples fuentes de informaci&oacute;n, derivados de diferentes contextos, tales como los financieros, la inform&aacute;tica de negocio, el ocio, las redes sociales y las redes laborales, las ciencias ambientales y tambi&eacute;n la salud. En este &uacute;ltimo &aacute;mbito existen m&uacute;ltiples fuentes de informaci&oacute;n derivadas de la medicina asistencial, la gen&oacute;mica, la biolog&iacute;a molecular, la cl&iacute;nica, la epidemiolog&iacute;a y la salud p&uacute;blica, entre otras.</font></p>     <p><font face="Verdana" size="2">La investigaci&oacute;n en salud p&uacute;blica y en epidemiolog&iacute;a tiene por objetivo conocer la salud de la poblaci&oacute;n y sus determinantes<sup>2</sup>. Los posibles beneficios de los <i>big data</i> en la investigaci&oacute;n en este campo son el uso de diversas fuentes de informaci&oacute;n y la rapidez en el an&aacute;lisis<sup>3</sup>. Estas dos caracter&iacute;sticas, seg&uacute;n algunas opiniones, podr&iacute;an dejar el m&eacute;todo cient&iacute;fico actual obsoleto<sup>4</sup>. No comparto esta &uacute;ltima opini&oacute;n. Parece que nos volvemos a enfrentar al mismo problema que hace tres d&eacute;cadas con la llegada de los ordenadores personales, cuando se cre&iacute;a que la velocidad de an&aacute;lisis iba a cambiar el m&eacute;todo cient&iacute;fico en la investigaci&oacute;n epidemiol&oacute;gica. Es por ello que centrar&eacute; mi contribuci&oacute;n a este debate en se&ntilde;alar los "peligros" del uso de los <i>big data</i> en la investigaci&oacute;n en salud p&uacute;blica y en epidemiolog&iacute;a.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana" size="2"><b>La necesidad de hip&oacute;tesis</b></font></p>     <p><font face="Verdana" size="2">Disponer de datos es una de las bases para el progreso cient&iacute;fico. En investigaci&oacute;n usamos modelos, a veces complejos, como una forma de aproximaci&oacute;n a la realidad. Estos modelos de an&aacute;lisis de datos se sustentan en hip&oacute;tesis y en marcos conceptuales, sin los cuales ser&iacute;a imposible realizar investigaci&oacute;n. Aunque parece claro que las hip&oacute;tesis han de guiar la investigaci&oacute;n cualquiera que sea el volumen de datos, existen diversas posiciones al respecto. Por un lado, est&aacute;n las personas que creen que los datos nos dir&aacute;n aquello que queremos saber. Esta posici&oacute;n es muy cercana al "ir de pesca" en los datos, adjudic&aacute;ndoles un cierto "buenismo" debido a que el gran tama&ntilde;o nos permitir&aacute; realizar inferencias estad&iacute;sticas fiables<sup>4</sup>. En el otro extremo se situar&iacute;an aquellas personas que creen que analizar los <i>big data</i> es analizar terabytes de ruido para obtener un megabyte de se&ntilde;al, y por tanto usar&iacute;an los <i>big data</i> en modelos causales m&aacute;s o menos simples que se prueban en entornos muy controlados.</font></p>     <p><font face="Verdana" size="2">Estas dos posiciones est&aacute;n explicadas de una forma un tanto simplista, pero describen las dificultades con que nos enfrentamos las personas que nos dedicamos a la investigaci&oacute;n, sin que por el momento tengamos una comprensi&oacute;n demasiado s&oacute;lida de c&oacute;mo abordar de manera sistem&aacute;tica y eficiente lo que suponen los <i>big data</i> en la investigaci&oacute;n en salud p&uacute;blica y en epidemiolog&iacute;a<sup>5</sup>.</font></p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p><font face="Verdana" size="2"><b>El origen de los <i>big data</i> y sus posibles sesgos</b></font></p>     <p><font face="Verdana" size="2">Los datos &uacute;tiles para la investigaci&oacute;n en salud p&uacute;blica y en epidemiolog&iacute;a proceden habitualmente de fuentes dise&ntilde;adas ad hoc para la investigaci&oacute;n o bien de fuentes secundarias, como las historias cl&iacute;nicas, pruebas de laboratorio, censo de poblaci&oacute;n, registros de enfermedades, etc. Lo que distinguir&iacute;a al entorno <i>big data</i> es, por un lado, la incorporaci&oacute;n de otras fuentes de informaci&oacute;n, como las derivados de los servicios prestados por las App de e-salud, <i>wereables</i>, las redes sociales o las plataformas "nube", entre otras, y la posibilidad de realizar la consulta a m&uacute;ltiples fuentes de datos <i>online</i><sup>4</sup>.</font></p>     <p><font face="Verdana" size="2">Hay que se&ntilde;alar que los datos que se obtienen de estas plataformas son muestras de conveniencia y pueden tener un n&uacute;mero importante de sesgos de selecci&oacute;n y de informaci&oacute;n, de los cuales no nos protege el tama&ntilde;o de los datos. Un ejemplo de sesgo de informaci&oacute;n podr&iacute;a ser el uso de los Twitterbots, programas usados para producir mensajes automatizados que permiten, mediante el acceso a potenciales clientes, mejorar el posicionamiento de una empresa. Al contrario, puede surgir un sinn&uacute;mero de asociaciones, algunas de ellas debidas al azar y a la existencia de sesgos como el de confusi&oacute;n. Tambi&eacute;n, las empresas de estas plataformas mejoran los servicios a los usuarios constantemente, lo cual podr&iacute;a afectar a la comparabilidad de los datos a lo largo del tiempo. Tampoco es f&aacute;cil obtener datos y replicar los resultados de los estudios para poder determinar su robustez.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana" size="2"><b>El an&aacute;lisis de los datos</b></font></p>     <p><font face="Verdana" size="2">La miner&iacute;a de datos es la exploraci&oacute;n autom&aacute;tica o semiautom&aacute;tica de los grandes conjuntos de datos con la intenci&oacute;n de descubrir patrones. Es uno de los pasos que componen el proceso del <i>knowledge discovery in databases</i><sup>6</sup>, en el cual se incluyen la recolecci&oacute;n y la preparaci&oacute;n de los datos, la interpretaci&oacute;n de los resultados y la informaci&oacute;n de estos. Sin embargo, la miner&iacute;a de datos genera ciertos desaf&iacute;os para la ciencia actual<sup>7</sup>. El primero, como ya se ha mencionado, es la b&uacute;squeda de patrones en los <i>big data</i>. Para ilustrarlo, Shiffrin<sup>7</sup> pone un ejemplo: "Supongamos una base de datos de un terabyte de datos con la posibilidad de contener mil factores medibles. El n&uacute;mero de posibles correlaciones de esos factores ser&iacute;a del orden de dos por mil". Y el segundo es la posibilidad de asociaciones espurias, que Shiffrin<sup>7</sup> expone claramente: "En una base de terabytes de datos, el factor A se correlaciona con el factor B, y esta podr&iacute;a ser una relaci&oacute;n causal directa entre ambos factores; sin embargo, tambi&eacute;n podr&iacute;a haber unos 10<sup>310</sup> otros potenciales bucles causales y las distribuciones de probabilidad asignadas a las 10<sup>310</sup> posibilidades".</font></p>     <p><font face="Verdana" size="2">La tecnolog&iacute;a permite y permitir&aacute; analizar un ingente volumen de datos y establecer innumerables asociaciones mediante modelos complejos. Habr&aacute; que desarrollar nuevas propuestas que traten los niveles de significaci&oacute;n estad&iacute;stica de forma diferente, tal como se hizo evidente al tener que desarrollar los <i>Manhattan plot</i><sup>8</sup> para los estudios de epidemiolog&iacute;a gen&eacute;tica. Sin embargo, la mayor complejidad de las herramientas anal&iacute;ticas podr&iacute;a tener como consecuencia posibles limitaciones en la transparencia de los m&eacute;todos y en la interpretaci&oacute;n y la replicabilidad de los resultados<sup>9</sup>.</font></p>     <p><font face="Verdana" size="2">Todo ello nos lleva a recordar los criterios de causalidad de Bradford Hill, en los que la fuerza de asociaci&oacute;n estad&iacute;stica es solo una de las nueve condiciones para establecer la causalidad<sup>10</sup>.</font></p>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2"><b>La generaci&oacute;n de conocimiento y su transferencia</b></font></p>     <p><font face="Verdana" size="2">La generaci&oacute;n de conocimiento es un proceso din&aacute;mico de s&iacute;ntesis, interpretaci&oacute;n, integraci&oacute;n y difusi&oacute;n de los resultados de la investigaci&oacute;n<sup>11</sup>. Es indudable que Internet ha permitido la mejora del trabajo de campo de las encuestas, la recogida de datos y los procesos de compartir datos y de intercambio del conocimiento<sup>12</sup>, como ya est&aacute; ocurriendo en algunas redes internacionales (por ejemplo, la de la malaria<sup>13</sup> y la de demograf&iacute;a<sup>14</sup>).</font></p>     <p><font face="Verdana" size="2">Sin embargo, existen otros &aacute;mbitos, como son las predicciones de alertas con consecuencias para la salud de la poblaci&oacute;n, en los cuales, aunque se ha demostrado el alto valor alcanzado, a&uacute;n se est&aacute; lejos de poder suplantar a los m&eacute;todos m&aacute;s tradicionales<sup>15</sup>.</font></p>     <p><font face="Verdana" size="2">Tampoco puede desecharse la posibilidad de la manipulaci&oacute;n por parte de empresas con &aacute;nimo de lucro, o bien desde visiones corporativas que muy l&iacute;citamente para sus intereses pretenden influir mediante los <i>big data</i> en las decisiones sobre la salud de la poblaci&oacute;n, sin obviar que puedan tener una mayor capacidad de transferencia que las instituciones p&uacute;blicas encargadas de la salud p&uacute;blica.</font></p>     <p><font face="Verdana" size="2">Un aspecto no desde&ntilde;able es poder refutar o aceptar resultados de estudios basados en los <i>big data</i>. No obstante, requerir&aacute; que el estudio est&eacute; bien sustentado metodol&oacute;gicamente, sea cual sea el origen de los datos.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana" size="2"><b>Aspectos sociales, &eacute;ticos y pol&iacute;ticos de la investigaci&oacute;n con <i>big data</i></b></font></p>     <p><font face="Verdana" size="2">La regulaci&oacute;n europea prev&eacute; la protecci&oacute;n de los datos personales, entre los que se encuentran los de la salud de la ciudadan&iacute;a<sup>16</sup>. Sin embargo, existen pa&iacute;ses donde la normativa puede ser m&aacute;s laxa o inexistente, y donde obtener estos datos puede ser m&aacute;s f&aacute;cil. Por otro lado, la dependencia econ&oacute;mica de los pa&iacute;ses de renta baja imposibilita que ejerzan la soberan&iacute;a sobre sus datos frente a los pa&iacute;ses de renta alta. A lo anterior cabr&iacute;a a&ntilde;adir que en la mayor&iacute;a de los casos es dif&iacute;cil que los resultados de las investigaciones reviertan en la poblaci&oacute;n que los ha originado, debido a la inestabilidad pol&iacute;tica, la corrupci&oacute;n, la pobreza y la precariedad de los sistemas de salud y del acceso a las nuevas tecnolog&iacute;as. Los avances cient&iacute;ficos que se deriven de esas investigaciones deber&iacute;an mejorar la salud y los determinantes de la salud de la poblaci&oacute;n en esos pa&iacute;ses.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana" size="2"><b>Conclusiones y recomendaciones</b></font></p>     ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2">Se concluye que las buenas pr&aacute;cticas en la investigaci&oacute;n en salud p&uacute;blica y en epidemiolog&iacute;a no han de ser diferentes para las investigaciones que usen <i>big data</i>. Por tanto, la divisi&oacute;n entre la investigaci&oacute;n con <i>big data</i> y la investigaci&oacute;n tradicional no parece pertinente.</font></p>     <p><font face="Verdana" size="2">Los investigadores e investigadoras de la salud p&uacute;blica y la epidemiolog&iacute;a deber&iacute;an desempe&ntilde;ar un papel central en la propuesta de hip&oacute;tesis innovadoras, en la construcci&oacute;n de infraestructuras para el almacenamiento de grandes conjuntos de datos y en asegurar el desarrollo de enfoques sistem&aacute;ticos en el an&aacute;lisis de grandes conjuntos de datos complejos y masivos. Para ello, las sociedades cient&iacute;ficas relacionadas con la salud p&uacute;blica y la epidemiolog&iacute;a deber&iacute;an proponer una estrategia formativa y abrir un debate necesario en nuestro colectivo.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana" size="2"><b>Contribuciones de autor&iacute;a</b></font></p>     <p><font face="Verdana" size="2">Autora &uacute;nica.</font></p>     <p>&nbsp;</p>     <p><font face="Verdana" size="2"><b>Conflicto de intereses</b></font></p>     <p><font face="Verdana" size="2">Parte de este texto se present&oacute; como comunicaci&oacute;n oral al II Congreso Iberoamericano de Epidemiolog&iacute;a y Salud P&uacute;blica.</font></p>     <p><font face="Verdana" size="2">La autora declara que pertenece al comit&eacute; editorial de GACETA SANITARIA, pero que no ha participado en el proceso editorial del manuscrito.</font></p>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p><font face="Verdana" size="2"><b>Bibliograf&iacute;a</b></font></p>     <!-- ref --><p><font face="Verdana" size="2">1. Khoury B.M.J., Ioannidis J.P.A. Big data meets public health. Science. 2014;346:1054-5.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505833&pid=S0213-9111201600010001400001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">2. Chun-Hai-Fung I., Tsz-Ho-Tse Z., Fu K-W. Converting big data into public health. Science. 2015;347:620.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505835&pid=S0213-9111201600010001400002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">3. Harvard School of Public Health. Big data's big visionary. Magazine. (Internet). Harvard; 2014. p. 32-49. (Consultado el 10/05/2015.) Disponible en: <a target="_blank" href="http://www.hsph.harvard.edu/news/magazine/big-datas-big-visionary/">http://www.hsph.harvard.edu/news/magazine/big-datas-big-visionary/</a>.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505837&pid=S0213-9111201600010001400003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">4. Standen A. How big data is changing medicine listen: KQED Science (Internet). 2014. (Consultado el 10/05/2015.) Disponible en: <a target="_blank" href="http://ww2.kqed.org/science/2014/09/29/how-big-data-is-changing-medicine/">http://ww2.kqed.org/science/2014/09/29/how-big-data-is-changing-medicine/</a>.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505839&pid=S0213-9111201600010001400004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">5. Birney E. The making of ENCODE: lessons for big-data projects. Nature (Internet). 2012;489:49-51.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505841&pid=S0213-9111201600010001400005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">6. Fayyad U., Piatetsky-shapiro G., Smyth P. From data mining to knowledge discovery in. Intell Artif Mag. 1996;17:37-54.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505843&pid=S0213-9111201600010001400006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">7. Shiffrin R. Introduction to the Sackler Colloquium, drawing causal inference from big data. Introduction to Sackler Colloqium (Internet), Washington, D.C.: National Academy of Sciences, (2015).    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505845&pid=S0213-9111201600010001400007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">8. Gibson G. Hints of hidden heritability in GWAS. Nat Genet (Internet). Nature Publishing Group;. 2010;42:558-60.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505847&pid=S0213-9111201600010001400008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">9. Boyd D., Crawford K. Critical questions for big data: provocations for a cultural, technological, and scholarly phenomenon. Information, Commun Soc. 2012;15:662-79.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505849&pid=S0213-9111201600010001400009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">10. Hill A-B. President's address the environment and disease. Proc R Soc Med. 1965;58:295-300.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505851&pid=S0213-9111201600010001400010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">11. Khoury M.J., Lam T.K., Ioannidis J.P., et al. Transforming epidemiology for 21st century medicine and public health. Cancer Epidemiol Biomarkers Prev (Internet). 2013;22:508-16.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505853&pid=S0213-9111201600010001400011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">12. Lang T. Advancing global health research through digital technology and sharing data. Science. 2011;331:714-7.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505855&pid=S0213-9111201600010001400012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">13. Hay S.I., Snow R.W. The Malaria Atlas Project: developing global maps of malaria risk. PLoS Med (Internet). 2006;3:e473.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505857&pid=S0213-9111201600010001400013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">14. Kowal P., Kahn K., Ng N., et al. Ageing and adult health status in eight lower-income countries: the INDEPTH WHO-SAGE collaboration. Glob Health Action (Internet). 2010;3:11-22.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505859&pid=S0213-9111201600010001400014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">15. Lazer D., Kennedy R., King G., et al. The parable of Google flu: traps in big data analysis. Science (Internet). 2014;343:1203-5.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505861&pid=S0213-9111201600010001400015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>    <!-- ref --><p><font face="Verdana" size="2">16. European Comission. Why do we need an EU data protection reform? (Internet). 2011. p. 10-1. (Consultado el 10/05/2015.) Disponible en: <a target="_blank" href="http://ec.europa.eu/justice/data-protection/document/review2012/factsheets/1_en.pdf">http://ec.europa.eu/justice/data-protection/document/review2012/factsheets/1_en.pdf</a>.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=2505863&pid=S0213-9111201600010001400016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <p><font face="Verdana" size="2"><a href="#top"><img border="0" src="/img/revistas/gs/v30n1/seta.gif" width="15" height="17"></a><a name="bajo"></a><b>Dirección para correspondencia:</b>    <br>Gl&ograve;ria P&eacute;rez    <br><a href="mailto:gperez@aspb.cat">gperez@aspb.cat</a></font></p>     <p><font face="Verdana" size="2">Recibido: el 13 de julio de 2015    <br>Aceptado: el 30 de septiembre de 2015</font></p>     ]]></body>
<body><![CDATA[ ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Khoury]]></surname>
<given-names><![CDATA[B.M.J.]]></given-names>
</name>
<name>
<surname><![CDATA[Ioannidis]]></surname>
<given-names><![CDATA[J.P.A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Big data meets public health]]></article-title>
<source><![CDATA[Science]]></source>
<year>2014</year>
<volume>346</volume>
<page-range>1054-5</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chun-Hai-Fung]]></surname>
<given-names><![CDATA[I.]]></given-names>
</name>
<name>
<surname><![CDATA[Tsz-Ho-Tse]]></surname>
<given-names><![CDATA[Z.]]></given-names>
</name>
<name>
<surname><![CDATA[Fu]]></surname>
<given-names><![CDATA[K-W]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Converting big data into public health]]></article-title>
<source><![CDATA[Science]]></source>
<year>2015</year>
<volume>347</volume>
<page-range>620</page-range></nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="journal">
<collab>Harvard School of Public Health</collab>
<article-title xml:lang="en"><![CDATA[Big data's big visionary]]></article-title>
<source><![CDATA[Magazine]]></source>
<year>2014</year>
<page-range>32-49</page-range><publisher-loc><![CDATA[Harvard ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Standen]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[How big data is changing medicine listen]]></article-title>
<source><![CDATA[KQED Science]]></source>
<year>2014</year>
</nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Birney]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The making of ENCODE: lessons for big-data projects]]></article-title>
<source><![CDATA[Nature (Internet)]]></source>
<year>2012</year>
<volume>489</volume>
<page-range>49-51</page-range></nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fayyad]]></surname>
<given-names><![CDATA[U.]]></given-names>
</name>
<name>
<surname><![CDATA[Piatetsky-shapiro]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
<name>
<surname><![CDATA[Smyth]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[From data mining to knowledge discovery in]]></article-title>
<source><![CDATA[Intell Artif Mag]]></source>
<year>1996</year>
<volume>17</volume>
<page-range>37-54</page-range></nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Shiffrin]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[Introduction to the Sackler Colloquium, drawing causal inference from big data: Introduction to Sackler Colloqium]]></source>
<year>2015</year>
<publisher-loc><![CDATA[Washington^eD.C. D.C.]]></publisher-loc>
<publisher-name><![CDATA[National Academy of Sciences]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gibson]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Hints of hidden heritability in GWAS]]></article-title>
<source><![CDATA[Nat Genet (Internet)]]></source>
<year>2010</year>
<volume>42</volume>
<page-range>558-60</page-range><publisher-name><![CDATA[Nature Publishing Group]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Boyd]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Crawford]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Critical questions for big data: provocations for a cultural, technological, and scholarly phenomenon]]></article-title>
<source><![CDATA[Information, Commun Soc]]></source>
<year>2012</year>
<volume>15</volume>
<page-range>662-79</page-range></nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hill]]></surname>
<given-names><![CDATA[A-B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[President's address the environment and disease]]></article-title>
<source><![CDATA[Proc R Soc Med]]></source>
<year>1965</year>
<volume>58</volume>
<page-range>295-300</page-range></nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Khoury]]></surname>
<given-names><![CDATA[M.J.]]></given-names>
</name>
<name>
<surname><![CDATA[Lam]]></surname>
<given-names><![CDATA[T.K.]]></given-names>
</name>
<name>
<surname><![CDATA[Ioannidis]]></surname>
<given-names><![CDATA[J.P.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Transforming epidemiology for 21st century medicine and public health]]></article-title>
<source><![CDATA[Cancer Epidemiol Biomarkers Prev (Internet)]]></source>
<year>2013</year>
<volume>22</volume>
<page-range>508-16</page-range></nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lang]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Advancing global health research through digital technology and sharing data]]></article-title>
<source><![CDATA[Science]]></source>
<year>2011</year>
<volume>331</volume>
<page-range>714-7</page-range></nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hay]]></surname>
<given-names><![CDATA[S.I.]]></given-names>
</name>
<name>
<surname><![CDATA[Snow]]></surname>
<given-names><![CDATA[R.W.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Malaria Atlas Project: developing global maps of malaria risk]]></article-title>
<source><![CDATA[PLoS Med (Internet)]]></source>
<year>2006</year>
<volume>3</volume>
</nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kowal]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Kahn]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
<name>
<surname><![CDATA[Ng]]></surname>
<given-names><![CDATA[N.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Ageing and adult health status in eight lower-income countries: the INDEPTH WHO-SAGE collaboration]]></article-title>
<source><![CDATA[Glob Health Action (Internet)]]></source>
<year>2010</year>
<volume>3</volume>
<page-range>11-22</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lazer]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Kennedy]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[King]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The parable of Google flu: traps in big data analysis]]></article-title>
<source><![CDATA[Science (Internet)]]></source>
<year>2014</year>
<volume>343</volume>
<page-range>1203-5</page-range></nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="">
<collab>European Comission</collab>
<source><![CDATA[Why do we need an EU data protection reform?]]></source>
<year>2011</year>
<page-range>10-1</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
