Noticias

Hitos de los Proyectos Emblemáticos del IMFD

Datos para el estudio de problemas sociales complejos; creación de nuevos lenguajes de consulta para redes de información; extracción eficiente de datos en escenarios de alta complejidad; inteligencia artificial con explicación; y generación de estructuras de información robustas, son los nombres de los cinco proyectos emblemáticos del Instituto Milenio Fundamentos de los Datos (IMFD). En esta nota, puedes conocer en qué está cada uno y cuál es el foco de su investigación.

 

  • Datos para el estudio de problemas sociales complejos:

¿Cuánto afecta el conflicto social en el destino de los proyectos sometidos al sistema de evaluación ambiental? ¿Cuál es el impacto real de estos proyectos en los indicadores de desarrollo de los territorios? ¿Cómo funciona el lobby ambiental en las empresas? ¿Qué son y donde se emplazan las zonas de sacrificio? ¿Cómo se configura la percepción de riesgo de salud de quienes habitan en zonas altamente contaminadas? Estas y otras preguntas se encuentran investigando académicos y estudiantes de postgrado pertenecientes al proyecto emblemático 1 (PE1).

A través de un trabajo sistemático que combina técnicas de recolección y análisis de datos estructurados y no estructurados, además de un trabajo en terreno en territorios afectados, los investigadores levantan resultados sobre las dinámicas de la institucionalidad ambiental, las industrias y los habitantes de los territorios. A partir de ahí, se logró comprobar que cuando los proyectos enfrentan acciones de protesta social, el plazo de tramitación de estos se extiende cerca de 400 días más que aquellos que no enfrentan conflicto. Sin embargo, la capacidad de los grupos organizados para dilatar proyectos no necesariamente lleva al retiro o rechazo de esos proyectos. La evidencia muestra que más del 63% de los proyectos han sido aprobados y menos del 5% rechazados.

El equipo de investigación que forma parte del PE1 sigue el trabajo guiado por otras preguntas. Respecto a los resultados, se han definido algunos patrones de emplazamiento, el timing del lobby ambiental y determinados impactos en los indicadores. También los datos han ayudado a aproximar mejor el trabajo de campo. El grupo ha comenzado a realizar trabajos de campo extenso en Ventanas, Cabrero, Coronel y próximamente en Mejillones y Tocopilla.

 

  • Nuevos lenguajes de consulta:

En el proyecto emblemático 2 (PE2), los investigadores Gonzalo Navarro y Juan Reutter, con el postdoc Javiel Rojas, desarrollaron una nueva representación compacta de bases de datos que permite ejecutar las operaciones de join, así como otras extensiones, en forma óptima. La operación de join es la más costosa de implementar y una de las más populares, en las consultas a bases de datos de todo tipo.

La representación ve a las relaciones como puntos en un espacio de alta dimensión y a la operación de join como una intersección de esos espacios, luego de subirles la dimensión aún más para hacerlos compatibles. Gracias a la representación diseñada, estos nuevos espacios mayores son virtuales y se recorren sin necesidad de generarlos físicamente.

Este trabajo ha sido aceptado en ICDT’20, una importante conferencia de teoría de bases de datos, que se desarrollará en Dinamarca.

Los investigadores están ahora trabajando en obtener una implementación práctica de esta técnica, junto con otros investigadores como Diego Arroyuelo, de modo de plasmar estos resultados en prototipos muy eficientes que puedan ser incorporados a sistemas reales de manejo de bases de datos.

 

  • Extracción de datos en escenarios de alta complejidad:

La principal preocupación del proyecto emblemático 3 (PE3) es diseñar herramientas que permitan a los sistemas de manejo de datos actuales, tratar con requerimientos altamente complejos. Aquí, algunos ejemplos en los que se ha estado trabajando:

Causalidad en bases de datos: en conjunto con investigadores de Technion Israel, se abordó el problema de identificar y cuantificar en qué medida las tuplas en una base de datos y los valores en ellas, contribuyen a una respuesta de consulta. El artículo será presentado en ICDT 2020, una de las conferencias más importantes en el área de teoría de los datos (Ester Livshits, Leopoldo E. Bertossi, Benny Kimelfeld, Moshe Sebag. The Shapley Value of Tuples in Query Answering. CoRR abs/1904.08679, 2019).

Manejo de datos bajo requerimientos de machine learning: requerimientos de eficiencia, han impulsado el diseño de lenguajes que permitan especificar propiedades usuales basadas en SQL junto a operaciones del álgebra lineal que se adecúen a los requerimientos del machine learning (ML). Un grupo de investigadores y alumnos del IMFD investigan las capacidades de estos lenguajes para especificar propiedades de uno y otro contexto. Parte de este trabajo fue aceptado para ser presentado en ICDT 2020 (Pablo Barceló, Nelson Higuera, Jorge Pérez, Bernardo Subercaseaux. On the Expressiveness of LARA: A Unified Language for Linear and Relational Algebra. CoRR abs/1909.11693, 2019).

Verificación de procedimientos para consultar APIs: desarrollado originalmente por Facebook y liberado al público en 2015, GraphQL se ha convertido en el lenguaje de definición y consultas de APIs preferido por la industria. En ese trabajo desarrollan la primera formalización de GraphQL completamente mecanizada, utilizando el asistente de pruebas Coq. Junto con resolver el problema de la imprecisión en la definición del lenguaje y de maximizar el nivel de confiabilidad de la formalización, este desarrollo en Coq ha permitido probar dos resultados fundamentales del lenguaje, relacionados a la transformación y a un mecanismo simplificado de evaluación de consultas.

Uno de los hitos del PE3 en 2019 fue la realización del workshop Emerging Challenges in Databases and AI Research (DBAI), que se llevó a cabo en Santa Cruz, VI Región, entre el 12 y el 15 de noviembre. Liderado por los investigadores Pablo Barceló, director del Instituto de Ingeniería Matemática y Computacional de la U. Católica y subdirector del IMFD; Leo Bertossi, académico de la Facultad de Ingeniería y Ciencias de la U. Adolfo Ibánez; y Aidan Hogan, académico del Departamento de Ciencias de la Computación (DCC) de la U. de Chile -todos investigadores del IMFD-, el encuentro reunió a 65 investigadores del área de bases de datos e inteligencia artificial, de diversas parte del mundo.

 

  • Inteligencia artificial con explicación:

El proyecto emblemático 4 (PE4) tiene como foco desarrollar nuevas técnicas de IA con explicación: entregar capacidades a los algoritmos de IA para explicar sus inferencias o decisiones. Con la colaboración de investigadores de la Universidad de Stanford, miembros de PE4 desarrollaron un sistema de IA capaz de utilizar lenguaje natural para explicar el razonamiento utilizado al contestar una pregunta visual. Por ejemplo, dada una imagen de un niño jugando con un perro, en una playa, y una pregunta sobre esta imagen como: ¿qué está haciendo el niño?, el sistema es capaz no solo de responder a la pregunta sino además justificar la respuesta. Este trabajo fue enviado para publicación a la revista Image and Vision Computing.

En otra línea de trabajo, miembros del PE4, en colaboración con investigadores del Centro de Desarrollo Urbano Sustentable (CEDEUS), han desarrollado un sistema basado en algoritmos de IA para reconocimiento visual y modelos econométricos, que permite explicar la manera en que las personas percibimos visualmente el entorno urbano. Los últimos avances han permitido cuantificar la heterogeneidad que existe en la percepción entre distintos grupos de personas. Por ejemplo, identificar que las personas que declaran utilizar modos de transporte activos -como bicicleta- perciben como más bonita la ciudad de Santiago que los usuarios de automóvil.

Una tercera línea de trabajo es la intersección entre visualización de información y técnicas explicables de IA. Se ha investigado el efecto que tienen diferentes tipos de explicaciones sobre la confianza de los sistemas de IA, tanto en sistemas de recomendación como en sistemas de clasificación de documentos. Sobre el primer tema, se presentó -en marzo de 2019- un trabajo en la conferencia internacional de interfaces inteligentes para usuarios (IUI 2019). Respecto al segundo tema, se desarrollaron diferentes formas de presentar visualmente la atención que ponen modelos de predicción de redes neuronales sobre textos de literatura médica. El área de explicabilidad y visualización del PE4 se está viendo especialmente en aplicaciones del área médica.

Este proyecto emblemático también dedica esfuerzos a extraer información de redes sociales, con la finalidad de proporcionar explicaciones de cuándo y por qué se producen efectos de polarización y/o controversia. En este sentido, la detección automática de posturas de usuarios (stance), la detección de noticias falsas y el estudio de las dinámicas de polarización en redes sociales, ocupan un lugar central dentro de las tareas que este proyecto lleva adelante.

 

  • Estructuras de información robustas:

El proyecto emblemático 5 (PE5) se ha enfocado en dos dos ejes principales durante este último semestre: el estudio de la propagación de desinformación en redes sociales y la investigación de incivilidad o lenguaje de odio en medios sociales. Aquí, algunas actividades destacadas de este proyecto:

Inicio del trabajo de investigación dentro del marco de una colaboración con Facebook: en junio, el equipo del IMFD asistió a Menlo Park, sede de Facebook en California, Estados Unidos, para una sesión de entrenamiento sobre la nueva base de datos de URLs compartidas en la plataforma entre 2017 y 2019. Actualmente se encuentran trabajando en el análisis para entender la difusión de contenido falso en Chile y América Latina.

El equipo del área de Ciencias Políticas, liderado por el investigador Juan Pablo Luna, hará disponible, públicamente, una base de datos de mensajes en redes sociales de 50 candidatos a la elección de diputados 2017, en Chile, junto a material etnográfico. Sobre esto se está desarrollando una tipología de campaña online y en terreno, que se usará como base para los papers que se trabajan en el proyecto de Facebook.

Datos para el estudio de problemas sociales complejos; creación de nuevos lenguajes de consulta para redes de información; extracción eficiente de datos en escenarios de alta complejidad; IA con explicación; y generación de estructuras de información robustas, son los cinco proyectos emblemáticos del IMFD.
Más noticias
Ver : Todas
Anual
2020
2019
2018
2017
2016
2015
Semestral
Semestre 1
Semestre 2
Mensual
January
February
March
April
May
June
July
August
September
October
November
December
Sin noticias en esta categoria
Mostrar más
Nada para mostrar