Buscar
Cerrar este cuadro de búsqueda.

Revista Capital

Inmaculada Pérez (GMV): “La UE debe conectar todos los centros sanitarios que producen datos”

Capital habla con Inmaculada Pérez, directora de Salud Digital en GMV 

datos
Por Alejandro Fernández

La tecnología se convierte en aliada de la sanidad y la gestión -y compartición- de los datos generados en los diferentes centros sanitarios mejora los tratamientos y la identificación de patologías y perfiles de pacientes. Analizados la importancia de las redes de datos sanitarios con Inmaculada Pérez, directora de Salud Digital en GMV. 

¿Qué es una red de datos sanitarios? 

Los sistemas sanitarios de nuestro país generan a diario una cantidad enorme de datos cuyo tratamiento entraña un gran conocimiento potencial, tanto para la investigación médica como en materia de calidad y sostenibilidad asistencial. Esta capacidad abre las puertas a descubrir nuevas dianas terapéuticas o biomarcadores más efectivos, para detectar enfermedades de forma temprana, mejorar la prognosis o personalizar el tratamiento farmacológico, así como para establecer indicadores de calidad asistencial entre otras aplicaciones. 

Sólo en España, además de los 17 Sistemas de Salud autonómicos y del Instituto Nacional de Gestión Sanitaria (Ingesa), según datos del Ministerio de Sanidad, cuenta con 35 institutos de investigación sanitaria acreditados, siete Redes de Investigación Cooperativa Orientadas a Resultados en Salud (Ricors) y 13 plataformas de apoyo a la investigación. Destaca también el Centro de Investigación Biomédica en Red (Ciber), que incluye once áreas temáticas presentes en casi todas las CC.AA.. A la vez, nos encontramos con los sistemas sanitarios de los 27 países que conforman la Unión Europea (UE). 

Todo este complejo y enriquecedor sistema sanitario nos lleva, en la era de la Inteligencia Artificial (IA) a enfrentarnos a un ambicioso reto, determinado por la necesidad de acceder de forma compartida a datos que residen en sus respectivos sistemas de salud, lo cual resulta muy complejo. Así, se crean redes de datos sanitarios como respuesta a la necesidad de conectar distintas fuentes de información y compartir datos de salud sin que la distancia o las fronteras constituyan una barrera. 

Una red de datos puede tener un carácter generalista y estar organizada en diferentes áreas, o bien puede ser temática, relacionada por ejemplo con la población y su estado de salud, hábitos de vida, determinadas enfermedades, recursos humanos, utilización de los servicios, actividades preventivas o el gasto sanitario. 

“La Unión Europea debe hacer un esfuerzo para conectar todos los centros sanitarios que producen datos” 

El pasado mes de noviembre, el Reino Unido liberó el mayor conjunto de datos genéticos disponible hasta ahora para investigación científica (medio millón de pacientes genotipados). En España y el resto de la Unión Europea no debemos quedarnos atrás y hemos de hacer un esfuerzo para que los centros que producen datos estén conectados, así como facilitar análisis seguro y en red. Merece mención especial el ejemplo que suponen las redes de los espacios de datos europeos Myhealth@EU para los datos de uso primario (asistencial) y el HealthData@EU para el uso secundario de los datos. 

¿Cuál es la propuesta de GMV para acelerar la investigación y obtener mejores resultados? 

Para acelerar la investigación biomédica y proporcionar mejores herramientas a los médicos, proponemos un enfoque tecnológico basado en crear redes federadas seguras que conectarán entre sí espacios de datos masivos. La principal ventaja que proporcionan las redes es la mejora de la calidad de los modelos matemáticos que se usan en machine learning, porque ésta depende del volumen de datos accesibles y de su heterogeneidad, aspectos que se ven reforzados al agregar tantas fuentes de información. 

Así, disponer de una red federada permitirá entrenar modelos nuevos con patologías que hasta ahora no habían sido posibles (como las enfermedades raras) y hacerlos más precisos y específicos, acordes al contexto sociodemográfico de cada paciente, ciudadano o localidad. Además, al disponer de datos de personas de diferentes poblaciones, estilos de vida y servicios de salud, seremos capaces de reducir el sesgo discriminatorio que padecen muchos de los algoritmos actuales. 

Otro de los beneficios que conlleva el uso de redes federadas es que permiten compartir el gasto económico, humano y medioambiental que acarrean la producción y la gobernanza de la información, pensando que se pueden también repartir los costes derivados del esfuerzo tecnológico, la computación, los procesos y la seguridad.  

Por último, de gran importancia en el ámbito de la salud, es la capacidad retrospectiva-prospectiva que nos pueden proporcionar las redes de datos. Un ejemplo concreto lo encontramos en el caso de estudios observacionales, donde podemos analizar variables antes y después de una determinada enfermedad. 

¿Qué ventajas aporta utilizar una red de datos sanitarios para la investigación ‘in silico’? 

La investigación hecha por computador necesita datos de calidad que simulen, en nuestro caso, a la población europea general, añadiendo otros datos científicos sobre genes, proteínas y vías metabólicas. Una red con una gran cantidad y variedad de datos nos habilitará para crear modelos que nos permitan simular con mayor precisión el comportamiento de un órgano o tejido, o la farmacocinética o farmacodinámica de un medicamento sobre una persona (paciente virtual). 

Todo ello, con el objetivo de conseguir una aproximación muy cercana a cómo se comportarían dichos fármacos en una muestra de población real, para alcanzar una medicina más personalizada y precisa. 

¿Cuál puede ser la estrategia de sostenibilidad de una red para investigación? 

La estrategia de una red de datos sanitarios de calidad y consolidada basa su sostenibilidad, principalmente, en la reutilización de datos y en la compartición de tecnologías y servicios, tales como la gobernanza, la seguridad, la validación, la certificación, etc. 

Los datos se convierten en la materia prima disponible para desarrollar tanto políticas de gestión como trabajos de investigación. Las redes de datos disponen de un catálogo de activos donde los interesados o los consumidores pueden acceder a ellos bajo procesos de gobernanza regulados y a través de un servicio proporcionado por la red con un coste por uso. En Reino Unido, por ejemplo, varias organizaciones han colaborado económicamente en la construcción de un biobanco, a cambio de tener acceso temprano a los datos.  

¿Qué tecnologías son necesarias en una red de datos? 

En el próximo mes de mayo se celebrarán reuniones sobre la «convergencia de tecnologías que permitan la I+i para la asistencia sanitaria del futuro», y sobre estrategias innovadoras y colaborativas, con enfoques para promover la atención integrada y con un énfasis particular en la conectividad de datos. Esto significa que las administraciones públicas y las organizaciones privadas tenemos que diseñar estrategias tecnológicas donde uno de los principales componentes sea la creación y la gobernanza de la red de datos. 

Respecto a la creación de las redes, es fundamental que el acceso a los datos sea seguro, incluso que se puedan analizar y entrenar modelos matemáticos sin necesidad de acceder directamente a los mismos, utilizando la tecnología llamada aprendizaje federado. La red debe construirse sobre el principio de “seguridad desde el diseño”, y utilizar estándares internacionales que permitan su incorporación a otras redes europeas. 

Las infraestructuras de red de datos han de contar también con tecnología para la constitución dinámica de nodos virtuales de almacenamiento, explotación y analítica por dominios temáticos. Con la gobernanza que incluya repositorio centralizado de metadato, herramientas de publicación de catálogos de los activos, capacidad de administración de la plataforma según los roles, responsabilidades y atributos definidos dentro del modelo de gobierno.  

Además, se necesitan herramientas de curación con perfilado de los datos, linaje, versionado, clasificación, uso de ontologías y configuración de flujos de trabajo de validación. La infraestructura debe proporcionar también herramientas de analítica y visualización, y mecanismos para distribuir la carga de trabajo sobre cantidades masivas de datos. Especialmente importantes son las herramientas para procesado de lenguaje natural, ya que se estima que aproximadamente un 80% de la información clínica y asistencial se encuentra en texto libre. 

“Aproximadamente un 80% de la información clínica y asistencial se encuentra en texto libre” 

Cabe mencionar que el Ministerio de Asuntos Económicos y Transformación Digital, a través de la Secretaría de Estado de Digitalización e Inteligencia Artificial, impulsa la creación de un hub nacional de Gaia-X, una entidad sin ánimo de lucro cuyo objetivo es acelerar la capacidad europea en materia de compartición de datos y soberanía digital, desarrollando una infraestructura de datos abierta y segura, para diferentes sectores entre los que se incluye el sanitario. 

¿Qué regulaciones protegen y garantizan la calidad y seguridad de una red de datos sanitarios? 

Fundamentalmente, la Ley de Datos, la Ley de Gobernanza de datos, el Reglamento Europeo sobre el Espacio de Datos Sanitarios y la Ley de Inteligencia Artificial. Estas normativas tienen como objetivo proporcionar un marco para la toma de decisiones y la compartición de datos, y se encargan de regular derechos de control sobre los usos secundarios (investigación) y primarios en salud (asistencial). 

En particular, y en el caso de las redes de datos, la Ley de Gobernanza de Datos tiene como objetivo regular la reutilización de datos protegidos, impulsando el intercambio y creando un entorno seguro para compartir datos entre los estados miembros de la Unión Europea, en beneficio de la sociedad y buscando un sistema más sostenible. Sin embargo, hoy en día, el intercambio de datos en la UE sigue siendo limitado debido a la escasa confianza, a las cuestiones relacionadas con la reutilización de datos del sector público y a otros obstáculos técnicos como la normalización, por ejemplo. 

En el caso de los datos de salud, se registra un extenso debate entre pacientes, profesionales sanitarios, pagadores, organismos asistenciales, investigadores y desarrolladores de tecnologías sanitarias. Ante este panorama, aparecen las redes de datos federados que ofrecen una metodología de tratamiento de datos con arreglo a las legislaciones locales. Esto podría resolver parte de los problemas regulatorios a corto plazo y facilitar el manejo de las redes de datos de una forma más rápida y segura. 

Finalmente, el pasado 8 de diciembre, el Parlamento Europeo y el Consejo alcanzaron un acuerdo sobre la Ley de Inteligencia Artificial de la Unión Europea. Esto es importante para las organizaciones sanitarias y las redes de datos porque la explicabilidad, monitorización de los modelos en producción y la gestión del sesgo van a ser requisitos de la nueva Ley. 

¿Quiénes podrían ser los integrantes o data providers de una red de datos? 

Los proveedores de datos principales serían los servicios de salud, tanto públicos como privados, dado que son los que recogen y almacenan la información clínica de los pacientes, de las enfermedades, de los resultados de sus tratamientos, de los procesos de gestión asistencial, etc. 

Pongo el acento en una cuestión que me gustaría remarcar. Existen multitud de factores ambientales que afectan a nuestra salud, como el clima, la exposición a los químicos, la contaminación del aire e incluso el aumento de los lugares ‘demasiado’ limpios. Todos estos factores constituyen el denominado como ‘exposoma’. 

Una red de datos sanitarios con accesibilidad tanto a estos factores externos, como a los datos clínicos de pacientes y ciudadanos, puede llevar a una mejora en la calidad de los resultados de nuestra investigación. Es por ello por lo que los sistemas informacionales de otros sectores son también fuentes de gran valor en el ámbito de la salud. 

¿Qué aporta la red de datos a la IA? 

Principalmente, una red de datos sanitarios aporta heterogeneidad, con lo que podemos entrenar modelos matemáticos para que sean más generales y precisos. Esta heterogeneidad de datos va a permitirnos afrontar uno de los requisitos de la Ley de la AI, que es generar modelos sin sesgo. Por poner un ejemplo, por distintas razones las mujeres con deterioro cognitivo y demencia han tenido históricamente menos probabilidades de participar en un ensayo clínico. 

El hecho de que los datos estén sesgados produce resultados imprecisos en su aplicación clínica, ya que han sido entrenados con una muestra no representativa de la población. Pero, además, se pierde potencia estadística en el estudio y disminuye la posibilidad de descubrir nuevos factores de riesgo, evidentes en el caso citado, ya que la incidencia de la enfermedad es mayor en mujeres. 

Es decir, a partir de más ejemplos diferentes de tratamientos de datos y de evolución de pacientes, los algoritmos infieren patrones y aprenden a generalizar de manera que, cuando reciben una historia clínica nueva, pueden predecir cuál sería el pronóstico para una determinada enfermedad o el resultado de un tratamiento. 

Por contra, si un modelo se entrena únicamente con datos de los pacientes de una región, es posible que los resultados no sean tan precisos al enfrentarse al caso de una persona de otra región. Esto es especialmente relevante en el caso de la imagen médica. Modelos matemáticos entrenados en una región están sesgados por las características de los equipos de imagen de que disponen. Así, al trabajar sobre imágenes de otras comunidades (que pueden usar otros modelos de equipos o de diferentes fabricantes) el trabajo de investigación no dará los resultados con la calidad deseada.  

¿Cuál es el principal impacto de la aplicación de la tecnología digital en la mejora del servicio al paciente? ¿Y, en particular, en una red de datos? 

El principal impacto de la aplicación de la tecnología en el sector sanitario es el despliegue de herramientas avanzadas con las que los profesionales sanitarios pueden obtener resultados precisos optimizando recursos. Ello revierte en su capacidad para realizar diagnósticos más tempranos, logrando afinar el pronóstico de enfermedades y, por consiguiente, actuando antes. En el ámbito de la gestión, la digitalización ayuda a detectar ineficiencias y con información de calidad poder tomar decisiones para priorizar entre los distintos servicios asistenciales.  

“Nuestra herramienta uTile revoluciona la forma en que aprovechamos los datos confidenciales y privados para potenciar nuestros algoritmos de aprendizaje” 

Estas tecnologías aplicadas a las redes sanitarias de datos permiten a los investigadores extraer conocimiento para abordar tratamientos más personalizados y precisos, considerando aquellos medicamentos más eficaces y con menos efectos adversos para cada paciente. En particular, las tecnologías digitales tienen un gran impacto en la construcción de las redes de datos, evitando limitaciones derivadas de exigencias de seguridad y preservación de la privacidad de la información, ya que hacen posible que los proveedores de datos (hospitales y servicios de salud) compartan datos sin necesidad de sacarlos de sus repositorios. 

¿Qué productos, servicios o proyectos innovadores podría destacar de los desarrollados por GMV en este ámbito? 

Una herramienta que me gustaría destacar es uTile, desarrollo que revoluciona la forma en que aprovechamos los datos confidenciales y privados para potenciar nuestros algoritmos de aprendizaje automático y modelos analíticos. Lo hace utilizando métodos criptográficos avanzados, que mantienen los datos cifrados en todo momento, incluso durante los cálculos más complejos, trabaja sin comprometer en absoluto los requisitos organizativos y la estricta conformidad con las normativas vigentes.  

En cuanto a los proyectos, cabe reseñar el proyecto Tartaglia, cuyo núcleo se define por la aplicación de tecnología en redes de aprendizaje federado para romper los silos de datos de los centros asistenciales, permitiendo crear modelos de IA mucho más robustos, sin exponer los datos ni moverlos de las organizaciones. Somos 16 las entidades encargadas de crear una red federada con inteligencia artificial para acelerar la investigación clínica y sanitaria en nuestro país. 

Entre ellas, se encuentran agencias, fundaciones e institutos de investigación ligados a servicios autonómicos de salud, universidades, spin-off, pymes de tejido nacional y grandes empresas de ámbito internacional. El consorcio público-privado ha obtenido la mayor puntuación de entre los proyectos presentados a la convocatorio Misiones de I+D en Inteligencia Artificial de la agenda España Digital 2025 y de la Estrategia Nacional de Inteligencia Artificial. 

Únete a nuestra Newsletter

A través de nuestra Newsletter con Capital te hacemos llegar lo más importante que ocurre en el mundo de la #economía, los #negocios, las #empresas, etc… Desde las últimas noticias hasta un resumen con toda la información más relevante al final del día, con toda comodidad.