Proyectos emblemáticos

Creación de nuevos lenguajes de consulta para redes de información

Las bases de datos de grafos, en las que la información es almacenada usando nodos y conexiones entre sí, son muy utilizadas en la actualidad debido a que existe gran cantidad de sistemas y aplicaciones (como las redes sociales) donde la información se modela naturalmente como un grafo. Además, la flexibilidad del modelo permite integrar nuevos datos de manera rápida y sencilla.

La clave del éxito de las bases de datos relacionales es que, desde los años 60, se estandarizó un lenguaje de consulta (SQL) potente y eficientemente implementable. Hasta ahora no existe un lenguaje estándar similar para consultar grafos.

Existen varias iniciativas que buscan desarrollar e implementar un lenguaje estándar de consulta para grafos, como G-Core y GraphQL, en las que trabajan activamente investigadores del Instituto Milenio Fundamentos de los Datos.

El objetivo de este proyecto es desarrollar técnicas que permitan llevar a cabo implementaciones eficientes y correctas de dichos lenguajes, para que trabajen sobre grandes volúmenes de información. Esto requiere, en paralelo, el desarrollo de técnicas de almacenamiento eficientes que permitan a estos lenguajes implementarse en forma fluida y eficiente sobre las bases de datos de grafos.

Proyectos relevantes

G-CORE: Se trata de un lenguaje de consulta que permite descubrir, extraer y comprender las relaciones más relevantes entre datos. Es desarrollado por un equipo internacional de 12 investigadores que incluye a académicos del Instituto Milenio Fundamentos de los Datos, al alero del LDBC Council y con empresas como IBM, Oracle y Neo4J. Esta iniciativa busca dar respuesta a la necesidad de contar con lenguajes de consulta en grafos. En particular, G-Core cuenta con dos características específicas: primero, la demostración matemática de todas las consultas que se realicen generarán resultados en un tiempo razonable y, en segundo lugar, las respuestas de G-Core son entregadas en la forma de bases de datos de grafos. Esto permite que sobre una consulta sea posible componer otras consultas, para poder extraer información de forma sofisticada.

Implementación eficiente de consultas: Recientemente se ha demostrado que la forma clásica de resolver consultas en bases de datos, tanto relacionales como de grafos, incluyendo las más eficientes implementadas en los motores más conocidos, puede ser mucho más lenta de lo necesario. Está surgiendo un nuevo mecanismo de resolver consultas que garantiza trabajar sólo lo necesario para entregar al usuario la información que necesita. Implementar de manera eficiente estos nuevos mecanismos, que se encuentran aún en etapa teórica, sobre estructuras de datos eficientes en espacio, es uno de los proyectos en los que está trabajando este grupo.

Directores de Proyecto

Gonzalo Navarro
Domagoj Vrgoč

Equipo de Trabajo

Renzo Angles
Diego Arroyuelo
Peter Boncz (CWI)
Carlos Buil
Claudio Gutiérrez
Aidan Hogan
Mauricio Marín (CeBiB)
Juan Reutter
Cristián Riveros
Andrea Rodríguez
Carlos Rojas
Diego Seco
Pablo Barceló
Leopoldo Bertossi
Dustin Cobas
Daniel Hernández
Federico Olmedo
Jorge Pérez
Carlos Ochoa
Alejandro Pacheco
Marcelo Arenas