Bienvenidos a la máquina del tiempo (de Barcelona)

Una demógrafa y una ingeniera rompen tópicos analizando con inteligencia artificial miles de documentos recopilados en los últimos cinco siglos

zentauroepp2313508 cuaderno del domingo foto a ria del eixample de barcelona   191024201058

zentauroepp2313508 cuaderno del domingo foto a ria del eixample de barcelona 191024201058 / TAVISA

Michele Catanzaro

Por qué confiar en El PeriódicoPor qué confiar en El Periódico Por qué confiar en El Periódico

La máquina del tiempo existe. Pero no tiene el aspecto del DeLorean chispeante de 'Regreso al futuro'. Sus piezas son escáneres y ordenadores. Estas son las herramientas de trabajo de Joana Maria Pujades y Alícia Fornés, dos investigadoras que han conseguido penetrar en el pasado de Barcelona como nadie lo había hecho antes.

Las dos científicas han analizado con inteligencia artificial centenares de miles de certificados de matrimonio, empadronamientos y otros documentos, redactados a lo largo de los últimos cinco siglos en Barcelona y alrededores. Los resultados han roto tópicos. Por ejemplo, la regla catalana del 'hereu' no fue tan férrea como parece. la revolución industrial no aumentó mucho la desigualdad: más bien cambió su naturaleza.

Un red social con el pasado

Parte de su trabajo se ha volcado en una plataforma que se parece un poco a Facebook. El sistema permite acceder a individuos que, de forma sorprendente, vivieron hace décadas, cuando no podían ni imaginar que acabarían en una red social. Big data conjugada en pretérito.

Las investigadoras tienen experiencia en toda clase de documentos. Por ejemplo, Fornés ha trabajado hasta con rollos de pianolas mecánicas. Ha convertido más de 3.500 de ellos en ficheros que se pueden escuchar en la web de la Biblioteca Nacional.

Ahora, las especialistas pretenden usar esta experiencia para procesar la información más disparatada: desde fotografías y cuadros hasta mapas y pentagramas. Todo ello debería converger en la Catalonia Time Machine: una plataforma digital que permita una inmersión lo más completa y realista posible en el pasado de Catalunya.

Parte del trabajo figura en una especie de Facebook que permite acceder a  barceloneses de otras épocas

Se trata de la versión local de un retahíla de 'máquinas del tiempo' parecidas, que se están desarrollando en varios puntos de Europa, desde Venecia hasta Ámsterdam. «Queremos automatizar la lectura de documentos de población, como esponsales y registros. Si un documento dice: ‘Pere Puig se casa con Maria Vila en la parroquia del Pi’, nuestro sistema debe entender cuál es el nombre del esposo, de la esposa, donde se casaron, etcétera», explica Pujades, que es jefa del área de Demografía Histórica en el Centre d’Estudis Demogràfics (CED), en Bellaterra.

En el 2010, bajo la guía de Anna Cabré, Pujades se puso a trabajar con 600.000 actas de matrimonio registradas en la diócesis de Barcelona entre 1451 y 1905. Se trata de un registro único, porque la diócesis tenía el privilegio de cobrar un impuesto proporcional a la renta de los novios, lo que «permite estudiar la desigualdad durante cinco siglos», explica Pujades. El procesado de los documentos reveló que la desigualdad en la ciudad era alta también antes de la industrialización. Lo que ocurrió con la revolución industrial es que cambió de causa. Antes, quienes ensanchaban la desigualdad eran los nobles, que acumulaban riqueza. Después fueron los obreros, cada vez más pobres.

La regla del ‘hereu’

«Con el método tradicional, este proyecto habría durado hasta mi jubilación», afirma Pujades. «Hemos puesto tecnología en algo muy tradicional, que es recoger las fuentes. Lo hemos modernizado y acelerado», explica. En los certificados matrimoniales también aparecen los nombres de los padres. Pujades y sus colaboradores lo aprovecharon para dibujar árboles genealógicos y estudiar cómo se difundía la riqueza a través las generaciones.

Según la norma del 'hereu', el primogénito se queda con todo el patrimonio. Así que las investigadoras esperaban que los otros hermanos y hermanas quedaran empobrecidos. Sin embargo, los impuestos de matrimonio revelan que eso no ocurre. «Aunque no hereden, siguen en la misma clase social. Probablemente, es el resultado de estrategias cooperativas. Por ejemplo, permitir que el rebaño del hermano pueda pastar en tierras del 'hereu'», explica Pujades. 

Construir el Big Data del pasado es un camino de retos. «El papel del manuscrito puede estar degradado, la grafía varía mucho, el vocabulario es antiguo…», explica Fornés, investigadora del Centre de Visió per Computador (CVC), también en Bellaterra. 

Un hallazgo es que la desigualdad no aumentó con la revolución industrial, sino que cambió su naturaleza

Fornés aborda estos retos por medio del 'deep learning' (aprendizaje profundo), el mismo principio que Google emplea en sus servicios. «Queremos que los ordenadores aprendan a leer», explica. En la práctica, se entrena al ordenador para leer unas palabras conocidas; luego, para leer todas las palabras escritas por la misma mano; más tarde, las de manos parecidas, y finalmente se le enseña a interpretar documentos de tipos distintos.

Para validar y reforzar el aprendizaje de la máquina, Pujades y Fornés han ideado un método insólito: un videojuego para el móvil. Cualquier persona puede descargarse su «cazador de palabras». La dinámica del juego obliga el jugador a identificar si, entre cinco términos manuscritos que el ordenador ha clasificado como iguales, hay alguno en realidad distinto. 

Simulacro de civilización

«La diferencia con los métodos tradicionales está en la cantidad de información que se maneja, pero esto acaba provocando una diferencia cualitativa», afirma Joan Anton Barceló, profesor del Departamento de Prehistoria de la Universitat Autònoma de Barcelona, y uno de los abanderados de las humanidades digitales en España. «En el caso de Barcelona, ya se empieza a ver que algunas de las grandes reconstrucciones históricas no cuadran», afirma el investigador, que no está implicado en el trabajo de Pujades y Fornés.

"Los algoritmos no reconocen   connotaciones sociales o errores», afirma el profesor Tim Brennan

Barceló quisiera ir aún más allá. «La gran revolución son las sociedades artificiales: crear un simulacro de una civilización en un ordenador. Lo que antes se describía con un texto ahora es un algoritmo que se puede comprobar con datos empíricos», dice. Barceló aborrece la investigación cargada de marcos ideológicos y confía en que las humanidades digitales reduzcan la arbitrariedad. 

Algoritmos y crítica

Esta posición genera rechazo en parte de la comunidad humanista. «Hay mucha mistificación sobre el poder de los algoritmos. En realidad, son tan buenos en reconocer patrones como lo son los que los programan. Extraen solo lo que quieres que extraigan», afirma Tim Brennan, profesor de Humanidades en la Universidad de Minnesota y crítico con las humanidades digitales.

«Los ordenadores no pueden reconocer connotaciones sociales, ironía, errores», añade. Brennan cree que el crecimiento de las humanidades digitales está incentivado por la voluntad de los departamentos de lograr fondos de empresas tecnológicas y de prescindir de trabajadores.  

"Queremos que los ordenadores  aprendan a leer», explica la investigadora Alicia Fornés

«Lo más importante es que este enfoque desplaza el pensamiento crítico. Tiende a ignorar que no existe ninguna posición fuera de un marco ideológico», afirma. Aun así, Brennan concede que los ordenadores pueden ser útiles para procesar grandes cantidades de material si se combinan con el control humano.

En esto, coincide con Fornés. «La inteligencia artificial no reemplazará a los humanistas. Pero le permitirá acelerar su trabajo y le sugerirá patrones que deberá interpretar. Creemos que es fundamental mantener a los humanos en el proceso», afirma.

La investigadora recuerda el caso de un documento con una gran mancha sobre unas palabras. El ordenador no podía leerlas. Entonces acudió un paleógrafo que, fijándose en la época, el estilo y la parroquia al cual pertenecía el documento, sentenció que no había duda. Las palabras debajo de la mancha eran «tejedor de lana».