Introducción
En los últimos años, los modelos de obtención de insights basados en las técnicas de Machine Learning han ido obteniendo cada vez mayor reconocimiento en todos los ámbitos de las tecnologías de la información1, desde el desarrollo de campañas de márquetin personalizadas2, al uso extensivo de tomas de decisiones en sectores financieros3,4 como al campo del procesado del lenguaje natural5.
Dentro del campo del procesado del lenguaje natural, existen dos aplicaciones específicas que pueden ser especialmente convenientes para el campo de la salud pública. El primero de ellos es el análisis de sentimiento (AS)6, también conocido como minería de opinión, que se encarga de identificar y extraer información subjetiva de los textos analizados, de una manera objetiva y sistemática, minimizando los tiempos y cuantificando los resultados obtenidos. Por otra parte, tenemos el modelado de temas o topic modeling (TM)7, que permite extraer estructuras semánticas subyacentes a los textos analizados, que podrían ocasiones permanecer ocultas, de manera automatizada. Una de las principales ventajas de esta metodología es que permite realizar el análisis de los textos de una manera rápida, eficiente y sistematizada, aumentando su valor científico por su alta reproducibilidad y objetividad8.
En este sentido, es lógico pensar que las bondades de esta metodología se deberían de poder emplear con éxito en el campo de los estudios de la salud pública. De esta manera, algunos autores ya han empezado a emplear éstas metodologías para analizar textos como encuestas de satisfacción de pacientes en el ámbito de las consultas sanitarias9,10. Pero también se están empezando a emplear estas técnicas a la revisión de literatura científica específica, tanto para la obtención de insights específicos11-13, herramientas de análisis de texto en bases de datos14, como herramienta alternativa a las metodologías clásicas de revisiones sistemáticas manuales8.
Además, el empleo de AS también ha sido empleado en las ciencias de la salud para diversos objetivos. Estudios de tendencias de violencia sexual en institutos mediante el uso de Twitter15, estudios epidemiológicos de las enfermedades transmitidas por los mosquitos16, estudio de riesgo de suicidios en la población17, herramienta de análisis de ciencias alimentarias y nutrición18, y por supuesto, también se ha empleado con éxito para la monitorización de brotes epidemiológicos durante la crisis del COVID-1919.
Por otra parte, debido a la inversión de la pirámide poblacional en los países occidentales20, y a la mayor tendencia a la hospitalización a domicilio21,22, tanto para el cuidado de mayores como para el cuidado de enfermos paliativos, los Servicios de Atención de Salud a Domicilio se han ido viendo incrementados en los últimos años23-25. Es por todo lo expuesto que aumentar el conocimiento respecto a los puntos de interés y las necesidades reales de este sector es de vital importancia de cara a tener una buena previsión de recursos y medios por parte de las autoridades competentes en el ámbito de la Salud Pública.
Por todo ello, el objetivo de este estudio fue el de obtener, de manera automatizada y objetivable, mediante modelos no supervisados de Machine Learning, los temas de mayor interés en los artículos científicos que trataban de la Salud Pública y los Servicios de Atención de Salud a Domicilio.
Métodos Diseño
Estudio descriptivo transversal mediante AS y TM de las fichas documentales recuperadas mediante técnica sistemática por su referencia.
Fuente de obtención de los datos
Los datos se obtuvieron por consulta directa y acceso, vía Internet, a la base de datos bibliográfica de ámbito científico-sanitario MEDLINE (vía PubMed).
Tratamiento de la información
La definición de los términos de búsqueda se realizó mediante consulta al Thesaurus de los Descriptores en Ciencias de la Salud (DeCS) desarrollado por el Centro Latinoamericano y del Caribe de Información en Ciencias Médicas (BIREME) junto con la equivalencia establecida por la U.S. National Library of Medicine, los Medical Subject Headings (MeSH).
Analizando ambos Thesaurus y sus fichas asociadas de indización (Entry Terms), se consideraron las siguientes ecuaciones de búsqueda:
Ecuación 1: Salud Laboral (Occupational Health)
“Occupational Health”[Mesh] OR “Occupational Health”[Title/Abstract] OR “Industrial Hygiene”[Title/Abstract] OR “Industrial Health”[Title/Abstract] OR “Occupational Safety”[Title/Abstract] OR “Employee Health”[Title/Abstract] OR “Occupational Exposure”[Mesh] OR “Occupational Exposure”[Title/Abstract] OR ”Occupational Stress”[Mesh] OR ”Occupational Stress”[Title/Abstract] OR ”Occupational Diseases”[Mesh] OR ”Occupational Diseases”[Title/Abstract] OR ”Occupational Hazard”[Title/Abstract] OR “Occupational Medicine”[Mesh] OR “Occupational Medicine”[Title/Abstract] OR “Occupational Health Safety”[Title/Abstract] OR “Occupational Stressor”[Title/Abstract] OR ”Occupational Factor”[Title/Abstract] OR “Professional Health”[Title/Abstract] OR “Workplace”[Mesh] OR “Workplace”[Title/Abstract] OR “Workplace Health”[Title/Abstract] OR “Workplace Safety”[Title/Abstract] OR “Safety Climate”[Title/Abstract] OR “Total Worker Health”[Title/Abstract] OR “Working Environment”[Title/Abstract] OR “Job Satisfaction”[Mesh] OR “Job Satisfaction”[Title/Abstract] OR “Job Stress”[Title/Abstract] OR “Job Security”[Title/Abstract] OR “Psychosocial Working Conditions”[Title/Abstract] OR “Employment”[Mesh] OR “Employment”[Title/Abstract] OR ”Labor Force”[Title/Abstract] OR “Labour Force*”[Title/Abstract] OR “Precarious Employment”[Title/Abstract] OR “Marginal Employment”[Title/Abstract] OR “Employment Insecurity” OR “Employment Insecurities”[Title/Abstract] OR “Employment Status”[Title/Abstract] OR “Occupational Status”[Title/Abstract] OR “Underemployment”[Title/Abstract] OR “Employee Health”[Title/Abstract]
Ecuación 2: Servicios de Atención de Salud a Domicilio (Home Care Services)
“Home Care Services”[MeSH] OR “Home Care”[Title/Abstract] OR “Domiciliary Care”[Title/Abstract] OR “Home Care Services, Hospital- Based”[Mesh] OR “Hospital-Based Home Care”[All Fields] OR “Hospital Based Home Care”[Title/Abstract] OR “Hospital Home Care Services”[Title/Abstract] OR “Hospital-Based Home Care Services”[Title/Abstract] OR “Hospital Based Home Care Services”[Title/Abstract] OR “Home Hospitalization”[Title/Abstract] OR “Hospital at Home”[Title/Abstract] OR “Hospital-at-Home”[Title/Abstract] OR “Hospital Home Care”[Title/Abstract] OR “Hospital at Home Care”[Title/Abstract] OR “Hospital in the Home”[Title/Abstract]
La ecuación de búsqueda final se empleó en la base de datos MEDLINE, vía PubMed, mediante la unión booleana de las 2 ecuaciones: Ecuación 1 AND Ecuación 2. Además, se empleó el filtro de “Clinical Trials” para obtener la máxima evidencia científica.
La búsqueda se realizó el 4 de septiembre de 2023.
Selección final de los artículos
Los artículos que fueron escogidos para el AS y TM cumplieron los siguientes criterios:
Inclusión: ser ensayo clínico, estar publicado en revistas arbitradas por pares y estar redactados en inglés.
Exclusión: no se estableció ningún criterio de exclusión.
Solamente se incluyeron artículos en lengua inglesa para poder hacer uso del diccionario de emociones de la National Research Council de Canada (NRC lexicon)26 por su extendido uso en este campo de investigación.
La selección de artículos pertinentes fue revisada por los autores del presente texto.
Extracción de los datos
El control de la corrección de los datos se realizó mediante el uso de dobles tablas. Esto permitió la posible detección de desviaciones y su posterior subsanación mediante nueva consulta a la fuente original de los datos.
Dado que todos los artículos fueron obtenidos de una única base de datos, no se debió tener en cuenta la gestión de artículos duplicados.
El almacenamiento de las fichas documentales de los artículos se almacenó como texto plano previo a su incorporación al sistema de análisis.
Análisis de los datos
Para el AS se utilizó el Diccionario NRC, que asocia cada palabra del corpus de artículos a una de las ocho emociones básicas definidas por Plutchik (ira, miedo, anticipación, confianza, sorpresa, tristeza, alegría y disgusto) y a dos sentimientos generales (negativo y positivo)27. Esta asociación se empleó para la realización de la nube de palabras, del gráfico de radar y del gráfico de evolución temporal.
La relación entre los diferentes sentimientos se cuantificó mediante la prueba U de Mann-Witney, y la relación entre las diferentes emociones se cuantificó mediante la prueba de Kruskal-Wallis.
Para la realización del TM se empleó el algoritmo de Machine Leaning no supervisado de la Asignación Latente de Dirichlet (ADL). Este algoritmo de clusterización de patrones realiza la suposición de que existen diferentes capas de patrones dentro de cada elemento de la población (no en número fijo). Además, asume que las distribuciones de las categorías siguen una distribución de Dirichlet28.
El análisis de datos se realizó mediante el software R v4.2.2 con el paquete de trabajo RStudio 2023.09.0 build 463. La librería específica relevante al TM fue “topicmodels” v0.2-14, mientras que las librerías empleadas para el AS fueron la “tidytext” v0.4.1, la “ggradar” v0.2, la “ggstream” v0.1.0 y la “wordcloud” v2.6.
Aspectos éticos
Todos los datos fueron obtenidos de las fichas documentales que aparen libremente en la base de datos de MEDLINE. Por esto, y conforme a lo establecido por la Ley 14/2007, de investigación biomédica29, no fue necesaria la aprobación del Comité de Ética e Investigación al utilizar datos secundarios.
Resultados
Al aplicar los criterios de búsqueda se recuperaron un total de 1889 referencias, todas ellas de la base de datos de MEDLINE (vía PubMed). Ninguno de estas referencias tuvo que ser eliminado por motivos de duplicidades ni por otros motivos de calidad.
Tras depurar aquellos registros que no eran ensayos clínicos (1.819), el número de artículos que se consideraron para su procesamiento en el análisis fue de 70. Ver figura 1.
Análisis de sentimiento
A la vista de la nube de palabras, obtenida a partir de las frecuencias de aparición de los términos del corpus de fichas documentales (ver figura 2), se pudo apreciar que la palabra que mayor frecuencia tiene es “dolor”, seguida por “puntuación” y “rehabilitación”. Además, se pudo constatar que no se tenía ningún color predominante en la propia nube, hecho que indicaba que ninguna de las emociones de la rueda de Plutchik tenía una relevancia mayor que el resto.
Además, en la segunda nube de palabras, referente a los sentimientos, se pudo apreciar que sí que existía una ligera mayor presencia de palabras concretas con carga negativa que positiva. Esto debido especialmente al tratamiento de temas relacionados con el dolor y las intervenciones y los riesgos. Esto no obstante no indicó una mayor presencia de palabras negativas frente a positivas, tan solo una mayor concentración en ciertas palabras. Esto se pudo cuantificar en los gráficos de cajas de la figura 3.
En estas gráficas se cuantificaron que existían diferencias estadísticamente significativas entre los dos sentimientos, así como entre las diferentes emociones aparecidas en los artículos.
En el gráfico de radar se cuantificó la intensidad de aparición de cada una de las emociones de la rueda de Plutchik: ira, miedo, anticipación, confianza, sorpresa, tristeza, alegría y disgusto (ver figura 4). Como se puede apreciar en el gráfico, la intensidad de las emociones en general no es muy alta en ningún caso. La emoción que presentó una mayor intensidad fue confianza, y las que menos disgusto y sorpresa seguidas por alegría; quedando anticipación, miedo y tristeza en un rango medio de intensidad.
El gráfico de evolución temporal de las emociones (figura 5) mostró que prácticamente en todo el período de estudio, la relación de aparición de las emociones en los artículos científicos se mantuvo estable, presentando pocas variaciones. Tan solo se destacaría una ligera variación en los últimos dos años de un aumento de la emoción de anticipación a costa de la emoción de confianza.
Topic modeling
En la figura 6 se puede apreciar el resultado obtenido de la aplicación del algoritmo de Machine Learning no supervisado ADL con 4 conjuntos de agrupaciones. Destacar que, en este tipo de metodologías, es el propio modelo el que se encarga de obtener las agrupaciones subyacentes (en este caso temas de los textos) a partir de la repetición de patrones y estructuras subyacentes en el corpus de textos analizados.
La Asignación Latente de Dirichlet trata cada documento como una mezcla de temas y cada tema como una mezcla de palabras, permitiendo que los documentos se superpongan por contenido en lugar de separarlos en grupos discretos, de manera que refleje el uso de lenguaje natural.
En el gráfico se muestran, para cada agrupación determinada por el algoritmo, aquellas palabras que tengan mayor influencia en los temas detectados. Esto se realiza cuantificando la frecuencia de aparición en las estructuras de los textos analizados.
Como se puede apreciar en el gráfico, los cuatro temas más predominantes que se encontraron en los textos fueron los siguientes:
TOPIC 1: Estudios con un tema que impliquen una intervención general en el cuidado domiciliario y su relación con la satisfacción de los cuidadores.
TOPIC 2: Estudios que tienen como foco el cuidado de los recién nacidos en los meses de lactancia de los trabajadores.
TOPIC 3: Estudios que tengan como objetivo conocer el devenir de la salud de los trabajadores a partir de programas de rehabilitación en los domicilios.
TOPIC 4: Estudios que tratan de la actividad física para mitigación del dolor de trabajadores.
Discusión
En primer lugar, se puede apreciar que los términos más empleados en los artículos científicos se centran en el dolor, las intervenciones domiciliarias, el cáncer, el embarazo y el sobrepeso. Salvo el término “dolor”, que sí que tiene una mayor presencia, ningún otro término destaca por encima del resto.
Además, gracias al estudio de frecuencia de aparición de las emociones, se pudo cuantificar que sí que existía una ligera tendencia estadísticamente significativa tanto del sentimiento positivo frente al negativo, como de las emociones asociadas al espectro positivo frente aquellas del espectro negativo. Esto era algo esperable ya que, en el ámbito científico, se suele emplear un lenguaje neutro-positivo, pero sin grandes cargas emocionales30.
Siguiendo con esta línea, en el gráfico de radar se puede corroborar esta idea, ya que se puede apreciar que la emoción con mayor intensidad estaba en el rango positivo de las emociones. Sin embargo, la intensidad de aparición de las emociones no es muy alta en ninguno de los ocho puntos cardinales del gráfico (oscilando en un rango de entre 10 y 5 puntos). El sentimiento de mayor prevalencia fue el de “confianza” y los que menos, “sorpresa” y “disgusto”. Como se ha comentado en el párrafo anterior, este resultado era el esperado debido a la general neutralidad empleada en la redacción de textos científicos30.
En la evolución temporal de las emociones, podemos ver que las proporciones aparecidas en el gráfico se mantienen bastante constantes a lo largo de todo el período de estudio, no habiendo ningún evento temporal clave que cambie esta tendencia, ni siquiera la aparición del COVID-19.
Finalmente, respecto al modelado no supervisado, se han podido determinar los cuatro temas de mayor interés tratado en los artículos científicos dentro del campo estudiado. Estos fueron el tema de los cuidados domiciliarios, con el nivel de satisfacción que presentaban los cuidadores; el tema de la gestión de los meses de lactancia por parte de las trabajadoras; el tema de los programas de rehabilitación a domicilio; y finalmente el tema de la actividad física para mitigar el dolor en trabajadores. Como se pudo apreciar, esta obtención de resultados se realizó de manera autónoma y repetible, ya que fue el algoritmo de Machine Learning el que se encargó de la determinación de los temas por la superposición de estructuras del lenguaje natural dentro del corpus de textos presentes en las fichas documentales de los artículos analizados.
Conclusiones
A la vista de los resultados, queda claro que las metodologías del procesado del lenguaje natural, tanto el AS, como los algoritmos de TM, pueden emplearse para extraer información subyacente de los textos científicos del ámbito de las ciencias de la salud de una manera objetiva y estructurada. En nuestro caso, se ha obtenido el resultado deseado, que era el de conocer de una manera clara y mediante técnicas no supervisadas, que evitan la introducción de sesgos humanos, los temas más tratados dentro del campo de la Salud Laboral y los Servicios de Atención de Salud a Domicilio.