Logo de Datalytics
Logo de Datalytics
Logo de Datalytics
Logo de Datalytics

Casos de éxito

SURA: IA Generativa para encontrar nuevas formas de gestionar la salud

Desde Datalytics —basados en tecnología de OpenAI— en seis meses desarrollamos una solución de IA generativa que permite, a los profesionales de la salud, utilizar los datos para diagnosticar enfermedades y entender la información genética de las poblaciones. 

Cliente: SURA – Empresa líder proveedora de seguros en LATAM. Cuenta con +10K de empleados en toda la región y +80 años de historia.

Tecnología: Azure Open AI, Azure BotService, Azure Cosmos, Azure function, AppService, Storage Account, Azure Container Instance

Tiempo: Seis meses.

SURA es la principal empresa aseguradora de Colombia y una de las más importantes de LATAM. Tiene más de 80 años de historia y actualmente cuenta con datos  en salud de más de 5 millones de personas afiliadas. 

En 2023 SURA inauguró su Centro de Ciencias Ómicas en la ciudad de Medellín. Desde allí se ocupan de explorar el ADN de las personas y de analizar los datos genómicos de la población para predecir, prevenir y diagnosticar enfermedades y encontrar nuevas formas de gestionar la salud. El objetivo es desarrollar medicina personalizada en la cual los pacientes se adueñen de su bienestar y puedan tomar decisiones basadas en los datos. 

Este tipo de ciencias —entre las que se incluye la genómica— generan muchísima información sobre el ADN humano que se debe procesar para poder entender.

 

¿Cómo se procesan los datos genéticos?

El ADN se extrae a partir de una muestra de sangre que da mucha información de la persona. Eso se pasa por equipos secuenciadores que brindan un listado de información de cuatro letras en las cuales está codificado el ADN. 

En un ser humano, en un solo genoma, hay tres billones de estas letras. Es una cantidad de información prácticamente inabarcable que hay que procesar y analizar para saber si, por ejemplo, un paciente tiene una enfermedad, por qué la tiene, si se puede dar una explicación genética, qué enfermedades podría desarrollar en el futuro, etc. 

Este proceso de interpretación es muy complejo y no puede hacerlo cualquier profesional de la salud, solo los especialistas en genética, biología molecular y afines tienen el conocimiento para esta tarea. 

Estos profesionales generan un reporte en PDF una vez que analizan la información y dan una interpretación clínica y biológica a los datos. Estos informes son tan técnicos y específicos que resultan difíciles de interpretar para médicos no especialistas. Sin embargo, contienen datos muy valiosos porque es información curada sobre el paciente. 

Por lo tanto, para empezar a entender cómo es la población, si hay relaciones entre las variantes, cómo influye la edad, los hábitos, etc. habría que hacer un cruce de información que, en la práctica, sería muy complicado porque manejaban más de 500 formatos con información.

Proceso de análisis genómico
Proceso de análisis genómico

Desafíos

“La información de los reportes de genómica se encuentra en formatos muy heterogéneos. Entonces, buscar algo allí requeriría mucho tiempo y dedicación. Es ahí donde encontramos una solución junto con nuestro aliado Datalytics. Decidimos utilizar modelos generativos de los cuales extraemos la información de los PDFs de forma sencilla y los llevamos a una base de datos estandarizada”, explica Catalina Bustamante, líder de tecnología del cetro de Ciencias Ómicas de SURA. 

A partir de esta situación, los principales desafíos fueron: 

  • Procesar grandes volúmenes de datos
  • La interoperabilidad, era necesario poder combinar los reportes de genética con los datos de historia clínica. 
  • Existencia de mucha información no estructurada muy relevante
  • Dificultad en la interpretación.  

 

Estrategia: ¿qué hicimos?

El objetivo fue extraer información de forma automática de los más de 10.000 PDFs en las variables que necesitábamos y llevarlo a un reporte estandarizado. 

“Hacer búsquedas sobre estas bases de datos requiere tener conocimientos técnicos de genética, lo cual no es muy común en el personal clínico, que, por su lado, sí tiene muy claro qué tipo de preguntas hacer y cuáles son los términos que se deben emplear. En este sentido, con IA generativa, diseñamos un bot que permite hacer preguntas en lenguaje natural a la base de datos”, agrega Bustamante

Junto con el equipo de SURA, desde Datalytics desarrollamos una solución basada en una instancia privada de Open AI que se alimenta con la información de los reportes genéticos del paciente. Posteriormente buscaremos integrar historia clínica, radiología etc.

Se trata de un chat —privado y restringido de Microsoft Teams— que usa la IA generativa para consultar datos. Los médicos interactúan en lenguaje natural lo que facilita el acceso y la comprensión de los datos genómicos.

Para lograrlo: 

  1. Estandarizamos los datos: usamos una estrategia apalancada en IA generativa que permite normalizar los tipos de datos que recibimos y ayuda a que las máquinas los interpreten. A partir de eso, los datos genéticos empezaron a poder consultarse como cualquier historia clínica.
  2. Usamos GPT para acceder a la información extraída, curada y disponible en una base de datos. A partir de esto, se pueden hacer preguntas en lenguaje natural, por ejemplo: ¿cuáles son los antecedentes familiares del paciente? GPT no sólo brinda un acceso sencillo a toda la información disponible, sino que también resume la información sin agregar interpretaciones que puedan ser erróneas.  

 

Los médicos no especialistas en genética pueden hacer preguntas de forma natural: ¿cuántos pacientes existen que tengan X variante que además tengan X patología?, ¿cuántos que tengan un antecedente de un padre menor a 40 años con X enfermedad? 

GPT es clave porque evita a los genetistas tener que hacer queries ya que convierte esas preguntas en una query que consulta a la base de datos y, una vez que lo hace, el agente de IA construye texto que brinda la respuesta a los médicos en lenguaje natural.

Consultas asistidas por IA generativa
Consultas asistidas por IA generativa

“Hacer búsquedas sobre estas bases de datos requiere tener conocimientos técnicos de genética, lo cual no es muy común en el personal clínico, que, por su lado, sí tiene muy claro qué tipo de preguntas hacer y cuáles son los términos que se deben emplear. En este sentido, con IA generativa, diseñamos un bot que permite hacer preguntas en lenguaje natural a la base de datos”, agrega Bustamante

 

Resultados

Vía chat, las personas responsables de la atención (médicos genetistas y profesionales en biología molecular) utilizando lenguaje natural, pueden hacer todo tipo de preguntas abiertas en varios idiomas. También pueden visualizar una respuesta integrada en lenguaje natural que resuma los hallazgos y lo presente con los documentos asociados.

Fredy Cuervo, profesional en biología molecular del centro de Ciencias Ómicas de SURA, dijo: “Este agente, nos permite hacer un análisis de las variantes genéticas que encontramos en el día a día, lo cual nos permite sustraer información de forma ágil y precisa. Nos ayuda a identificar con qué tipo de enfermedad está relacionada, el tipo de patogenicidad, nos permite agilizar tiempos para los análisis y acceder a la información de forma más rápida para las investigaciones”. 

“Esta herramienta apoya a los profesionales en salud e investigadores, en la comparación de información entre pacientes y principalmente permite consolidar la información poblacional para producir investigaciones y crear nuevos servicios y productos que contribuyan al bienestar de las personas”, concluye Carlos Andrés Agudelo, gerente del área de Biociencias de SURA.

Compartir: