Agenda

A Domain-independent and Multilingual Approach for Crisis Event Detection and Understanding
30/sep

ABSTRACT

Durante una crisis (por ejemplo, terremotos, manifestaciones y tiroteos), muchos usuarios de medios sociales comparten actualizaciones oportunas que pueden ayudar a mejorar el conocimiento de la situación. Esto ha motivado a los investigadores de múltiples campos relacionados con las emergencias a estudiar el comportamiento de la propagación de la información en línea.

La mayoría de los estudios realizados hasta ahora se han centrado en la caracterización y detección de crisis a través de los medios sociales. Por lo general, han analizado eventos específicos en lugar de estudiar los patrones transversales que surgen de las conversaciones en línea durante las crisis. Además, los estudios han considerado los mensajes en inglés como idioma principal debido a la disponibilidad de recursos (por ejemplo, herramientas de procesamiento del lenguaje natural) y datos. Sin embargo, las crisis suelen producirse en países (por ejemplo, Chile e Italia) en los que las lenguas no inglesas son el idioma principal (por ejemplo, el español y el italiano, respectivamente). Por lo tanto, existe una brecha en la comprensión de las comunicaciones de crisis en diferentes dimensiones, como los idiomas, los dominios y las ubicaciones geográficas.

En este trabajo, presentamos un estudio a gran escala de las crisis debatidas a través de las plataformas de los medios sociales.  Nuestro objetivo es descubrir y comprender los patrones universales de comunicación relacionados con las crisis en diferentes tipos de eventos, ubicaciones geográficas e idiomas. En esta línea, innovamos en tres áreas: 1) proponemos metodologías para caracterizar y descubrir patrones generales de los mensajes de los medios sociales en una diversidad de crisis. Entre ellos, analizamos las discusiones controvertidas en eventos de larga duración y las características comunes y disímiles de múltiples catástrofes. 2) realizamos un estudio exhaustivo para clasificar los mensajes relacionados con las crisis teniendo en cuenta una evaluación experimental multilingüe y multidominio. 3) implementamos un método para detectar eventos de crisis que es agnóstico de los tipos de eventos y del idioma de los mensajes.

 

PRESENTER
Hernán Sarmiento es Ingeniero Civil en Informática de la Universidad Técnica Federico Santa María y Magíster en Ciencias de la Computación de la Universidad de Chile. Actualmente se encuentra culminando su Doctorado en Ciencias de la Computación en la Universidad de Chile. Su tema de tesis abarca el análisis de redes sociales durante situaciones de crisis con un enfoque agnóstico al idioma y tipo de evento. Adicionalmente, Hernán es postdoctorado del Instituto Milenio de Fundamentos de los Datos (IMFD), centrando su investigación en estudiar fenómenos socio-colectivos en redes sociales. Sus intereses se centran en analizar y entender grandes volúmenes de datos generados por usuarios en la Web, haciendo uso de técnicas de minería de datos, machine learning, análisis de redes y NLP.

 

WHEN AND WHERE

Viernes 30 de septiembre a las 11,30 horas en Sala Javier Pinto, DDC UC.

Campus San Joaquín, Universidad Católica.