"No todo está en Google". Y Matías Naranjo sabe de lo que habla, y más si se trata de los más de 40 años de historia de búsqueda de las Abuelas de Plaza de Mayo. El estudiante de la Universidad Nacional de Rosario (UNR) es uno de los tres integrantes del equipo "Three Data Scientist" que hicieron un aporte para crear un algoritmo que permite digitalizar todo el archivo periodístico de la organización que trabaja en la búsqueda de los nietos y nietas desaparecidos durante la última dictadura cívico militar. El trabajo, realizado por este rosarino, un chaqueño y un cordobés, todos expertos en datos, permitirá ahora procesar más de cuatro décadas de historia de los derechos humanos y hacerla accesible a través de un software. "Estamos orgullosos de haber contribuido a preservar la historia de nuestro país a través de la ciencia de datos y la tecnología", dijo Naranjo a La Capital tras haber recibido de la Fundación Sadosky el tercer premio en el desafío “IA por la Identidad”.
Matías trabaja en datos desde hace un tiempo, pero viene de la música vinculada a la tecnología. A poco de recibirse en la carrera de Música y Producción de Tecnologías Aplicadas al Arte Sonoro en la UNR, la pandemia lo empujó a trabajar en otras áreas y comenzó a desempeñarse en el manejo de datos para una multinacional como Cargill. En un espacio de formación virtual conoció a Oscar Bonfanti de Universidad Tecnológica Nacional de Resistencia y a Joel Stanich, del Instituto Politécnico Provincial de Córdoba. "No nos conocíamos personalmente, en estas cosas raras y a veces frías que tiene esto de trabajar en datos, pero los tres decidimos participar del desafío", contó sobre el inicio del proceso.
image - 2023-09-26T141419.679.png
"Three Data Scientist", equipo a pleno durante la recepción del premio en la Fundación Sadosky.
El desafío “IA por la Identidad” que lanzaron conjuntamente la Fundación Sadosky y las Abuelas de Plaza de Mayo planteaba justamente dar una solución que todavía, como afirma Naranjo, los navegadores de internet no puede dar: la digitalización de su archivo periodístico, es decir una recopilación histórica de más de 45 años de trabajo
El proceso estuvo lleno de obstáculos por resolver porque más allá de todas las bondades de la IA, Naranjo deja en claro que "aún es complicado que estas tecnologías tengan la interpretación que tiene naturalmente el cerebro humano".
"Llevamos adelante ese proceso desde afuera, incluso sin vernos personalmente como equipo y recién al final, cuando recibimos el reconocimiento, conocimos a algunas de las abuelas y de los nietos recuperados, tomamos dimensión de la experiencia", dijo Naranjo sobre el orgullo de "contribuir a preservar la historia de nuestro país a través de la ciencia de datos y la tecnología".
Material de difícil acceso
"El archivo de las Abuelas es algo de muchísimo valor, pero también de difícil acceso", explicó el rosarino, aunque dejó en claro que todo lo que él y su equipo llevaron adelante fue posible gracias a un trabajo previo que ya habían realizado desde la organización de derechos humanos y que había sido el scaneo de cada una de las noticas del archivo.
"Uno de los nietos recuperados fue quien hace tres años había comenzado de ese trabajo -continuó-. Lo hizo y quedaron allí un montón de imágenes y nuestro trabajo, justamente era darle valor eso que había hecho y sin lo cual no habríamos tenido material sobre el cual poder avanzar".
Lo cierto es que no sin obstáculos, el trabajo que realizó el equipo fue procesar la información que estaba en imágenes para que pase a texto, es decir el desarrollo de un OCR que es un programa que permite justamente llevar adelante un reconocimiento óptico de los caracteres.
"Le pedimos que lea y ahora ya no lee la imagen, sino el texto", explica Naranjo y agrega: "Hicimos eso, pero al cuadrado porque las imágenes en la prensa tienen una complejidad mayor en el formato de la noticia, hay que discriminar lo que es publicidad, una noticia comienza en una página y continúa en otra y la noticia tiene diferentes partes: títulos, copetes, cuerpos y autores, todo eso que ojo humano clasifica fácilmente, la máquina no".
Sin embargo, recién con el trabajo ya hecho y el galardón otorgado, cuando se encontraron personalmente como equipo y compartieron tiempo tanto con abuelas como con nietos recuperados, el proyecto del que habían formado parte tomó "dimensión histórica", señalaron.
"En tiempos donde se cree que todo está en Google, recopilaciones de este tipo poseen un valor incalculable y es gratificante aportar un granito de arena para que pueda utilizarse con mayor facilidad", afirman como los tres especialistas.
Además, Naranjo reconoció que compartir con algunas de las integrantes de Abuelas, escucharlas hablar "sobre la importancia de que los jóvenes tomen la posta desde una perspectiva muy sabia y emocionadas de ver ver cosas nuevas que se aplican y que permiten mantener vivas estas bibliotecas que tiene más de 40 años de historia fue lo más fuerte del proceso".