Noticias

Sistema permite anonimizar de manera automática datos de pacientes COVID-19

14 de abril de 2020.– Durante las últimas dos semanas, la Dirección de Innovación y Transferencia Tecnológica del Instituto Milenio Fundamentos de los Datos (IMFD) ha trabajado a tiempo completo para desarrollar un software que permitiría a la autoridades de salud anonimizar de manera automática los datos sensibles que recopila de pacientes y casos sospechosos de COVID-19.

Este programa cumple con uno de los compromisos del instituto en el marco de su trabajo en la mesa de datos: generar una herramienta que garantiza la disponibilización de información para el estudio de la pandemia, protegiendo los antecedentes privados de las personas.

El sistema se encuentra listo para ser utilizado por la autoridad sanitaria y funciona, a grandes rasgos, así: al igual que en otros software, primero se debe crear un archivo de configuración a través del cual se define los distintos conjuntos de datos que se requieren. A esto se lo conoce como “niveles de agregación de información”.

Luego, se carga la base de datos original que recoge el sistema de vigilancia y, usando la configuración determinada, se genera un dataset. Como se pueden crear distintas configuraciones, es decir, con diferente nivel de agregación de información, el programa generará datasets para cada una de ellas. Finalmente, cada set de datos es evaluado para medir la probabilidad de que un paciente sea identificado, lo que indica qué riesgos se corren si se publica el resultado.

Además, se definieron protocolos de funcionamiento para asegurar que el operador del software no tenga la posibilidad de filtrar los datos. Por ejemplo, el programa sería ejecutado en un computador sin conexión a internet, que recibiría los datos encriptados a través de medios físicos como un pendrive o disco duro externo.

El programa fue desarrollado específicamente para responder a las necesidades del Minsal en esta crisis, con información aportada por epidemiólogos respecto de los campos que recoge el sistema de vigilancia y, por ahora, no será adaptado a otros fines. Su objetivo es apoyar el quehacer de los trabajadores del área, al automatizar un proceso que –de ser hecho manualmente– requiere alta inversión de tiempo de recursos humanos, escaso en tiempos de crisis como el que vivimos, y una necesaria revisión del nivel de anonimización de los resultados.

Martín Ugarte, CEO de la Unidad de Innovación y Transferencia Tecnológica, señala que “es necesario aclarar que no se trata de un programa muy complejo, es una herramienta que elimina ciertos campos de una base de datos y luego calcula medidas clásicas de de-identificación para asegurar la privacidad de las personas. Tengo la certeza de que hay muchos equipos en Chile capaces de crear herramientas similares. Nuestro compromiso era crearlo lo más rápido posible y con nuestro equipo trabajamos para tenerlo listo, en caso de ser requerido”.

Modelos y visualizaciones

Los reportes generados por este software podrían ser usados por los centros de investigación que han desarrollado modelos que buscan proyectar el comportamiento del coronavirus en Chile.

Algunos de estos necesitan, por ejemplo, contar con información espacio-temporal, es decir, cuándo y en qué comunas han surgido peaks de contagio, para predecir la propagación del virus. El software les entregaría los antecedentes que requieren de manera inmediata sin comprometer la privacidad de los pacientes.

El IMFD lidera uno de los equipos interdisciplinarios que trabaja en este frente, formado por investigadores de las áreas de epidemiología, políticas públicas y ciencia de datos. Con las bases de datos que el programa de anonimización pueda entregar, este equipo podrán probar los modelos de comportamiento del virus y enriquecer los parámetros para obtener estimaciones más precisas.

Junto con esto, la Dirección de Transferencia Tecnológica trabaja en el desarrollo de visualizaciones interactivas de información pública sobre el coronavirus, para que la sociedad acceda de manera directa a estadísticas y datos relevantes respecto del brote del COVID-19 en el país. Las personas podrían seleccionar variables que les parezcan de interés y conocer a través de gráficas interactivas, por ejemplo, los porcentajes de incidencia del virus a nivel de comuna o las edades de los afectados en determinados tramos de tiempo.

La imagen muestra, a modo de ejemplo y con datos ficticios, cómo se vería esta plataforma, que estará disponible con mayores niveles de información en mediano plazo.

—–

Información: innnovacion@imfd.cl

 

Una vez anonimizados los datos, el sistema puede generar bases de datos con distintos niveles de profundidad.
More news
View : All
Annual
2020
2019
2018
2017
2016
2015
Biannual
1st semester
2nd semester
Monthly
January
February
March
April
May
June
July
August
September
October
November
December
No news in this category
Show more
Nothing to show