“El computador nos puede ayudar a ser mejores, pero hay que cuidar no traspasarle nuestros sesgos” – Instituto Milenio Fundamentos de los Datos

Con la palabra “gato” en distintos idiomas e imágenes de felinos, Jorge Pérez, académico de Ciencia de la Computación en la Universidad de Chile e investigador del Instituto Milenio Fundamentos de los Datos, arrancó su presentación en la VI Conferencia Internacional de Cultura Científica de la Universidad Andrés Bello, encuentro abierto a todo público y que busca acercar el conocimiento científico a la sociedad en general.

Los distintos significados y formas de graficar el concepto “gato” fueron el enganche para explicar cómo los computadores entienden el lenguaje humano y representan el significado de una palabra mediante códigos. Entre risas y participaciones espontáneas, los asistentes fueron comprendiendo la lógica de la asociación entre las palabras y el significado que entregaba el computador mediante códigos.

El investigador dio ejemplos cercanos de las aplicaciones de sus investigaciones, en el campo del análisis de datos políticos. Un ejemplo de ello fue el proceso constituyente de 2016, donde diseñó un Explorador Constitucional, que analizó los temas más recurrentes en las asambleas ciudadanas según comuna.

Galaxia de conceptos

Su trabajo más reciente en esta línea es la construcción de una “galaxia donde cada estrella es una frase que dijo Michelle Bachelet en el gobierno anterior. Computé la representación de cada una de ellas y las puse en tres dimensiones para poder explorarlas”, señaló, mientras proyectaba una compleja nube de datos tridimensional.

Lo asombroso de este análisis es que no es una síntesis, sino que abarca todos los discursos de la ex presidenta, lo que es posible gracias a que todas sus alocuciones están digitalizadas, explicó Jorge Pérez.

El investigador ejemplificó con la frase «cada uno sabe dónde le aprieta el zapato», de Bachelet: el sistema pudo identificar todas las veces en que fue dicha durante su segundo gobierno. Esta galaxia está disponible on-line para quien quiere consultarla, en el link bit.do/galaxia-presidencial

Alcances de la inteligencia artificial

Desde el público surgió una pregunta sobre el uso de datos en el contexto de la Inteligencia Artificial. «La forma en que hoy entrenamos a la Inteligencia Artificial es con datos. Tenemos tantos datos, que podemos decirle a una máquina que aprenda de ellos. Pero los sesgos de los datos también los va a aprender. Los científicos tenemos que hacernos cargo de eso: una Inteligencia Artificial no va a aprender algo que no le estoy mostrando», afirmó el investigador, a la vez que aclaró que los sesgos se repiten con todos los idiomas, no sólo en el caso del español.

Jorge Pérez dejó un desafío en el aire: que en este tipo de investigaciones -basadas en datos o que buscan conocer mejor al usuario- «la ética debería estar presente en todo momento. Los científicos deberíamos premiar trabajos que aumenten la ética» y concluyó afirmando que «el computador puede entender hasta cierto punto el lenguaje humano. Nos puede ayudar a ser mejores, pero hay que tener cuidado de no traspasarle nuestros propios sesgos».