Page 73 - Anuario AC/E de cultura digital 2017
P. 73
existentes y no una muestra o un grupo redu- cido, como se solía hacer hasta ahora.
Frente a esta perspectiva no han sido pocos los trabajos que han tenido por objetivo revalidar la importancia de las teorías, los modelos y las hipótesis para investigar. Por un lado, hay que recordar que nuestro patrimonio cultural (docu- mentos, textos, pinturas, imágenes, sonidos) no está digitalizado por completo pese a los esfuer- zos colectivos de iniciativas como Europeana. Según el último informe realizado por el pro- yecto de la Comisión Europea llamado ENUME- RATE (Nauta y Wietske, 2015), en la actualidad solo un 23% de las colecciones europeas ha sido digitalizado. La encuesta fue respondida por unas mil instituciones europeas como bibliote- cas, museos, archivos, etc. Estas instituciones aún tienen pendiente digitalizar un 50% de sus colecciones y admiten que un 27% de los objetos que preservan no serán digitalizados. Las cifras ponen de relieve que gran parte de nuestro patrimonio no es accesible en Internet.
Desde un punto de vista humanístico, pues, cuesta creer que el análisis de grandes cantidades de datos vuelva inútil el método científico, ya sea porque jamás disponemos de todos los datos existentes —una de las premisas del Big Data es la Velocidad con que se generan nuevos datos—, ya sea porque los datos son erróneos o ambiguos, ya sea porque el procesamiento (automático o no) de los datos está determinado por nuestra cultura y, por tanto, contiene sesgos ideológicos. Por ejemplo, tomemos el caso de CollateX; esta herramienta está diseñada para cotejar textos que presentan ligeras variaciones y alinear las partes de los textos que difieren. Entre otros presupuestos del algoritmo, hay que destacar que para CollateX no es relevante distinguir entre una transposición o cambio de lugar de una porción de texto (por ejemplo, en un poema, una estrofa que aparece desplazada o en distinto lugar) y una sustitución (es decir, la eliminación de una estrofa en un sitio y la adición de los mismos versos en otro lugar) (Van Zundert, en prensa); la cuestión aquí no es determinar si el algoritmo de CollateX es correcto. Los investiga- dores pueden estar de acuerdo o no, pero la clave estriba en conocer esta elección, esta preferencia, y ser consciente de que condiciona los resultados y la interpretación.
Fragmento de un grafo de variantes creado con la herramienta CollateX.
Algunos autores, de hecho, defienden que, en la era del Big Data, las teorías y los modelos cobran aún mayor importancia porque es necesario explicar y entender los fenómenos analizados mediante abstracciones. En las humanidades digitales el concepto de «modelo» está muy extendido porque ayuda a explicar el núcleo del trabajo de digitalización. Los modelos se entien- den como herramientas, esquemas o diseños utilizados en un contexto específico con unos fines determinados, a veces prácticos (poner en línea un conjunto de textos), pero, a menudo,
Por un lado, el proceso de digitalización siempre implica una selección basada en los recursos disponibles por la institución o el grupo de trabajo encargado de digitalizar los documentos; pero también responde a razones ideológicas e identitarias. No hay que olvidar que los museos, bibliotecas y archivos son instituciones financia- das con dinero público y que tienen por función preservar y difundir el patrimonio cultural de una comunidad (por ejemplo, una nación). Por
el otro, los formatos, lenguajes de marcado y al- goritmos también están inscritos en una cultura y una ideología determinadas, y llevan consigo adheridos muchos presupuestos que varían en función del contexto.
ANUARIO AC/E DE CULTURA DIGITAL 2017
73
Cultura inteligente: Análisis de tendencias digitales