Logo de la Universdad de Valencia Logo Máster Universitario en Investigación en Lenguas y Literaturas Logo del portal

La digitalización literaria

Si buscamos lo opuesto a la macroliteratura, a raíz de los libros publicados por el escritor Franco Moretti, podemos determinar que sería la filología o el close reading. El autor defendía una lectura comparada de la literatura internacional donde lo microscopio (las figuras, los poemas, los libros o autores concretos) tuvieran menor importancia que lo macroscópico (los géneros o los números  de traducciones). Sin embargo, desde que Moretti publicase sus planteamientos ya han pasado más de 15 años y el proceso de digitalización se ha hecho imparable. El big data “ha cambiado nuestra forma de entender el mundo”, tal y como explica Jorge Carrión en su artículo “Literatura y ‘big data’”, publicado por el periódico La Vanguardia. 

13 de septiembre de 2016

Carrión parte de los libros y clases que Moretti impartió en Stanford, así como de sus publicaciones en la revista New Left Review para hablar de sus “Conjeturas sobre la literatura mundial” (2000), donde el escritor trató de dibujar las pautas del sistema-mundo que a su parecer creaba la novela moderna. Aseguraba que existía una correlación entre la economía y las formas literarias, sin embargo, para algunos la poesía hispanoamericana , por ejemplo, no se adaptaba a esta premisa y por ello se posicionaron en contra de sus planteamientos.

 Aseguraba que existía una correlación entre la economía y las formas literarias

A todos ellos les dedicó posteriormente “Más conjeturas sobre la literatura mundial” (2003), un compendio de todas las críticas recibidas y las respuestas del autor, que no hacían sino reafirmar su postura: “desplazar la mirada de los textos aislados y presuntamente extraordinarios a la gran masa textual”.

Años más tarde, tal y como relata el periodista, en 2004; se presentó en la Feria de Frankfurt Google Print, que pronto sería Google Books, lo que suponía “una base de datos que parecía diseñada para elevar a la enésima potencia los análisis y los resultados de las lecturas cuantitativas de la literatura, después de siglos de estudios basados en conceptos esquivos y caprichosos, como gusto y calidad”, asegura Carrión.

Sin embargo, hay que ser más precisos ya que como subraya el periodista la revolución del big data en las humanidades digitales no radica únicamente en la cantidad, sino más bien en la calidad; pero no de los textos sino de los patrones que se extraen de los datos: “las interpretaciones que les otorgan sentidos”, explica Carrión. Por tanto, hablamos de una forma nueva que construye modelos y relatos tan buenos o mejores que aquellos sustentados tradicionalmente en la reflexión, la intuición o el cruce de un número limitado de lecturas personales o colectivas.

La revolución del big data en las humanidades digitales no radica únicamente en la cantidad, sino más bien en la calidad; pero no de los textos sino de los patrones que se extraen de los datos

Por su parte, Matthew L. Jockers, discípulo de Moretti ;  ha cruzado cerca de 3.592 textos publicados entre 1780 y 1900 para descubrir que los autores más populares fueron, contrario a lo que se piensa, Jane Austen y si Walter Scott. “Tanto en términos de recursos estilísticos como en contagio de temas ningún otro escritor de la época fue capaz de una influencia similar a la de ellos”, confirma Carrión.

En este sentido, destacan también Ryan Heuser y Long Le-Khac, quienes mediante sus investigaciones establecieron otro corpus de novelas decimonónicas (2.958 títulos) y determinaron que a medida que avanzaba el siglo se incrementaba el número de términos que indican acción, así como las palabras que describen partes del cuerpo humano (dedo o cara). Con lo que podría decirse que así “se expresa el proceso de urbanización y el nacimiento de la masa moderna”, escribe el periodista de La Vanguardia.  

Así mismo, esta literatura condicionada por el algoritmo exige un nuevo tipo de investigador literario. Alguien con conocimientos en informática y matemáticas. Destaca en este ámbito el manifiesto firmado por 14 autores, además de Google Books team, “Quantitative analysis of culture using millions of digitized books”, el cual habla de trabajar en culturomics: la economía de la cultura, la cultura cuantificada; explica Carrión.

Esta literatura condicionada por el algoritmo exige un nuevo tipo de investigador literario

Y en medio de toda esta evolución posteriormente surgió el Google Ngram Viewer, que permite a los lectores llevar a cabo sus propias búsquedas estadísticas. “Las palabras introducidas son rastreadas y encontradas en más de cinco millones de libros en inglés, español, francés, ruso, chino, alemán y hebreo publicados entre 1500 y el 2008; y convertidas en un gráfico”, destaca Carrión. No obstante, tener los hechos no significa tener las interpretaciones; las cuales podrían tardar años en formularse.

En medio de toda esta evolución posteriormente surgió el Google Ngram Viewer, que permite a los lectores llevar a cabo sus propias búsquedas estadísticas

En definitiva, este avance es significativo en la medida en que tanto el léxico como la retórica tratados estadísticamente pueden inclinar la balanza cuando existen dudas acerca de quién escribió realmente una obra. En esta era digital, el flujo de información es tan elevado que es difícil  distinguir una nueva idea propia sin relación con la textualidad que nos envuelve. Para ello, son varias las formas de trabajo en red que han proliferado durante el cambio de siglo