El impacto de los grafos en la IA generativa: destacada participación del IMFD en la International Semantic Web Conference ISWC-2025
La última edición de la International Semantic Web Conference (ISWC), la conferencia más importante del mundo en Web Semántica, contó con una destacada participación de investigadores del Instituto Milenio Fundamentos de los Datos.
Sebastián Ferrada, académico de la Iniciativa de Datos e Inteligencia Artificial (IDIA), formó parte del comité organizador y presentó dos papers seleccionados en los exigentes tracks de investigación y recursos. En tanto, Aidan Hogan, director del Departamento de Ciencias de la Computación de la Universidad de Chile, presidió la sesión de TGDK (Transactions on Graph Data & Knowledge), revista de la cual es cofundador y Editor-in-Chief, y presentó dos trabajos de investigación en el Wikidata Workshop.
ISWC es considerada como la conferencia fundamental para el desarrollo de los Grafos de Conocimiento, un campo clave para el desarrollo de sistemas de IA más precisos y explicables, instancia que cuenta con un alto prestigio internacional. Este año, la rigurosidad fue especialmente alta: el track de investigación tuvo solo un 20% de aceptación, mientras que el track de recursos alcanzó un 23%.
Este año, el premio que reconoce el impacto a 10 años de los trabajos presentados en ISWC fue entregado al equipo de RDFox por el proyecto “RDFox: A Highly-Scalable RDF Store”: ellos lanzaron una empresa para comercializar este motor, que fue adquirida por Samsung. Hoy en día, esta tecnología, que nace desde la investigación en el área de la web semántica, está instalada en cada teléfono Samsung S25. “Este es un buen ejemplo del tipo de impacto que la comunidad ISWC puede tener, y de transferencia tecnológica que se puede potenciar desde los artículos de investigación a las personas”, destaca Aidan Hogan.
La 24ª Conferencia Internacional sobre la Web Semántica (ISWC 2025) se celebró en el Centro de Convenciones Prefectural de Nara, Japón, del 2 al 6 de noviembre de 2025. La conferencia abarcó temas teóricos, analíticos y empíricos de la Web Semántica, grafos de conocimiento (Knowledge Graphs) y tecnologías de Linked Data. También incluyó aplicaciones prácticas y herramientas de software.
Organización y spotlight
Sebastián Ferrada, como parte del comité organizador, coordinó la generación de los proceedings oficiales de la conferencia, trabajo que describe como clave para dar visibilidad y trazabilidad a la investigación global en Web Semántica y a los cuales se puede acceder en https://link.springer.com/book/10.1007/978-3-032-09527-5.
El investigador y académico de IDIA, presentó dos papers, uno de ellos fue “Graph Querying or Similarity Search? Both!”, que combina dos mundos que históricamente se resolvían por separado: las consultas semánticas en grafos y las búsquedas por similitud. El equipo del IMFD: Vicente Calisto, Juan Pablo Sweet, Juan Reutter y Domagoj Vrgoc (Ambos académicos del DCC UC) y Gonzalo Navarro del DCC UChile, desarrolló dos algoritmos que superan a los gestores de bases de datos de grafos actuales cuando se enfrentan a grandes volúmenes de resultados.
Ferrada detalla que este tipo de consulta es especialmente útil en grafos multimedia, análisis discursivo o métodos modernos como Graph-RAG para agentes de Inteligencia Artificial, que combinan modelos de lenguaje con datos estructurados. El artículo fue seleccionado como spotlight paper por parte de la conferencia, por lo que tuvo un alto interés e impacto en la audiencia, de más de 150 asistentes.

En tanto, en “COTTAS: Columnar Triple Table Storage for Efficient and Compressed RDF Management”, desarrollado en colaboración con Julián Arenas-Guerrero, académico del Ontology Engineering Group de la Universidad Politécnica de Madrid, propone un formato comprimido y consultable para almacenar grafos RDF utilizando Parquet. Su contribución es significativa: logra comprimir los grafos a la mitad del tamaño de la técnica líder actual (HDT) y permite realizar consultas básicas de forma sensiblemente más rápida.
Compromiso con la ciencia abierta
Aidan Hogan, director alterno del Instituto Milenio Fundamentos de los Datos y director del DCC U. Chile, presidió como chair de la sesión de la revista TGDK (Transactions on Graph Data & Knowledge), revista de la cual es cofundador y Editor-in-Chief. Esta revista es de acceso abierto y gratuito, y en la sesión se presentaron 16 artículos publicados por el journal. “TGDK representa el compromiso, tanto del Departamento de Ciencias de la Computación de la Universidad de Chile, como del Instituto Milenio Fundamentos de los Datos, con la facilitación del “open science”, y la buena recepción que ha tenido nos habla de la valoración que tiene esta iniciativa en la comunidad”, destaca el investigador.
En el ISWC-2025 se realizó el Wikidata Workshop, que se ha establecido como un espacio clave para abordar los desafíos principales asociados con Wikidata, incluyendo la calidad de los datos, el multilingüismo y las dinámicas de los grafos de conocimiento colaborativo. El workshop puso un énfasis especial en la intersección de Wikidata y la Inteligencia Artificial Generativa (IA Generativa), reuniendo investigadores y profesionales con el objetivo del Workshop de fomentar discusiones sobre el rol de los grafos de conocimiento en un mundo impulsado por la IA.

En este espacio fue presentado el demo paper DataQuest: Web Augmentation with Wikidata, de Diego Pizarro, DCC Universidad de Chile & IMFD; Sergio Firmenich, Universidad Loyola Andalucía; y Aidan Hogan, DCC, Universidad de Chile & IMFD. Este trabajo consiste en una extensión de navegador diseñada para enriquecer la navegación web al aprovechar el poder del grafo de conocimiento de Wikidata. La relevancia de DataQuest radica en su capacidad para contextualizar dinámicamente el contenido web. Específicamente, cuando un usuario visita una página web en su navegador que contiene un identificador externo previamente registrado en Wikidata, la extensión DataQuest realiza una consulta al grafo para recuperar información sobre la entidad asociada.
La información extraída de Wikidata se utiliza para dos propósitos clave: mostrar detalles adicionales sobre la entidad al usuario y orientar los siguientes pasos de navegación. Este enfoque transforma la navegación pasiva en una experiencia aumentada con datos estructurados y semánticos.
En el mismo workshop, el trabajo de Alberto Moya Loustaunau y Aidan Hogan, ambos investigadores del IMFD y del Departamento de Ciencias de la Computación de la Universidad de Chile, presentaron QAWiki: A Knowledge Graph Question Answering & SPARQL Query Generation Dataset for Wikidata, artículo que fue reconocido como Best Paper. En este artículo se describe un conjunto de datos fundamental para la tarea de responder preguntas en lenguaje natural sobre grafos de conocimiento (KGQA). Los investigadores presentan QAWiki, un conjunto de datos multilingüe y creado a mano, diseñado específicamente para el desafío de Respuesta a Preguntas sobre Grafos de Conocimiento (KGQA) y la generación de consultas SPARQL sobre Wikidata.

El dataset consta de 526 preguntas y es de valor excepcional porque es multilingüe, presentando cada pregunta en inglés y español, incluyendo versiones parafraseadas y anotaciones detalladas de menciones de entidades y relaciones de Wikidata. Este recurso es crucial, ya que puede ser utilizado como un dataset de evaluación y entrenamiento para sistemas de KGQA y generación de consultas.
El equipo del IMFD ha fortalecido su compromiso con la ciencia abierta (open science) al alojar QAWiki en una instancia de Wikibase, lo que permite la edición y el refinamiento colaborativo por parte de la comunidad internacional.
La utilidad inmediata de QAWiki ya ha sido demostrada con experimentos ilustrativos utilizando modelos de lenguaje avanzados como GPT-4o para generar consultas SPARQL sobre Wikidata. “La calidad y relevancia de este dataset han motivado al equipo a planificar una competencia internacional basada en QAWiki para impulsar la investigación en KGQA, la que estamos preparando y presentaremos a la comunidad internacional”, destaca Aidan Hogan.
La participación del IMFD en la ISWC 2025 subraya la capacidad de la investigación generada en Chile para influir directamente en las tecnologías de gestión de datos a nivel mundial. El contenido de las ponencias está disponible en los proceedings de ISWC 2025.



