Noticias
Octubre de 2020.- El Instituto Milenio Fundamentos de los Datos (IMFD) y la Corte Suprema establecieron un acuerdo de colaboración que busca, entre otros objetivos, desarrollar un sistema de categorización y búsqueda de la información contenida en las sentencias judiciales.
En la ceremonia de firma del convenio, Guillermo Silva Gundelach, presidente de la Corte Suprema, señaló que la sociedad y todos los sectores y rubros “nos hemos visto enfrentados a un nuevo fenómeno, la acumulación de información en volúmenes nunca antes vistos”. En el caso específico de la Corte Suprema, la autoridad explicó que “contamos con un océano gigantesco de información, a nuestros ojos inabarcable, sobre el desempeño de la justicia”.
En la actualidad, la base de datos de la Corte Suprema posee más de 400 mil fallos judiciales digitalizados desde el año 2005 a la fecha. José Luis Palma, Jefe del Centro Documental de la Corte Suprema, señala que “cada vez que se hace algún tipo de análisis para sacar datos relevantes de una sentencia, se hace de forma manual. Intentar analizar todas las sentencias dictadas por el Poder Judicial tomaría, por tanto, mucho tiempo y mucha gente”.
¿Por qué el desafío es importante? Palma explica que en esos fallos existe información que permitiría, entre muchas otras aplicaciones, que una persona se documente sobre cómo se ha fallado en causas similares a la suya hasta hacer estudios sobre jurisprudencia en las más diversas áreas, desde trabajo a género.
Marcelo Arenas, director del IMFD, señala que “ese volumen de información es muy difícil de manejar y, a pesar de que han creado herramientas que los ayudan en esta tarea, queda mucho por hacer. Nuestro instituto espera aportar en la generación de sistemas para extraer información desde esos datos, colocarla en plataformas permitiendo su análisis eficiente, la búsqueda de patrones o desarrollar visualizaciones, entre otras funciones”.
Pedro Contreras Flores, Jefe de la Unidad de Apoyo Informático de la Dirección de Bibliotecas de la Corte Suprema, describe que –para lograr este objetivo– una de las grandes tareas a abordar es la aplicación de técnicas de procesamiento de lenguaje natural, para sistematizar la extracción de datos, mejorar las clasificaciones y categorías, y –con ello– optimizar y enriquecer las búsquedas.
Los sistemas de búsqueda que esperan crear en colaboración con el IMFD permitirían, por ejemplo, explorar fallos por temas: “Si buscamos sentencias relacionadas con daño medioambiental, vamos a contar con el dato georreferenciado para saber dónde hubo casos de daño ambiental o qué tipo de problemas”, agrega Contreras.
Justamente por la amplitud de aplicaciones y usos que puede tener esta información, parte clave del trabajo del IMFD es lograr la anonimización de datos críticos, como los relativos a menores de edad, por lo que el proyecto también abordará los desafíos científico técnicos de tratar con información altamente sensible, indica Arenas.
Finalmente, para el director del Instituto Milenio Fundamentos de los Datos, este proyecto es un ejemplo de las múltiples necesidades que nuestro país debe abordar de forma urgente: “El Estado genera muchos datos, los que son importantes para tomar decisiones sobre políticas públicas. Lo que debemos lograr es tener las mejores herramientas posibles para tomar estas decisiones de manera informada”.