martes, 13 de octubre de 2015

Optimización de los procesos de gestión de colecciones especiales de la Biblioteca de Investigación Juan de Córdova con DSpace


Patricia Alejandra Méndez Zapata.
Maestra en bibliotecología. Biblioteca de Investigación Juan de Córdova, Fundación Alfredo Harp Helú Oaxaca AC. Oaxaca, México.

Eduardo Javier Rivero López
Licenciado en ciencias de la informática. Biblioteca Daniel Cosío Villegas, El Colegio de México AC. Distrito Federal, México.
Palabras Clave
Repositorios digitales, DSpace, México, Oaxaca, Biblioteca.

Resumen
El objetivo de éste documento es, presentar la metodología utilizada para la implementación de un repositorio de acceso abierto en los procesos de gestión de colecciones digitales en la Biblioteca de Investigación Juan de Córdova (BIJC), dando énfasis en las mejoras que se han obtenido a partir de ello, mostrando como ejemplo el proyecto de  organización, resguardo y preservación de la colección fotográfica y documental de “Irmgard Weitlaner Johnson” (IWJ) (1914-2011), quien fuera precursora en México de investigaciones sobre textiles arqueológicos e indígenas.
Introducción
La Biblioteca de Investigación Juan de Córdova, es una biblioteca especializada en filología mesoamericana, ubicada en la ciudad de Oaxaca, conformada por un poco más de 25000 obras, que datan de 1500 a la fecha, algunas de las cuales, debido principalmente a su antigüedad, estado de conservación y falta de organización son de acceso restringido, como es el caso de la colección de Irmgard W. Johnson.
En este contexto se diseñó un proyecto con el objetivo de organizar  la colección antes mencionada e implementar DSpace como repositorio para la biblioteca.
Debido a lo anterior, los objetivos principales de este trabajo son, describir las fases en las que fue llevado a cabo dicho proyecto y mostrar las mejoras que se han tenido como resultado de la ejecución del mismo.
1. Contexto: la Biblioteca de Investigación Juan de Córdova
El área de acervos de la Biblioteca es una unidad académica especializada cuyos objetivos son “localizar, evaluar, reunir, organizar, preservar y brindar acceso oportuno a los recursos informativos especializados en lengua y cultura de los pueblos indígenas de Oaxaca, México y Mesoamérica, buscando ser intermediaria entre los pueblos y su historia”.
En esta se resguardan colecciones de importantes investigadores, como la de John Paddock (1918-1997), pionero de la arqueología y etnohistoria oaxaqueña; Luis Castañeda Guzmán (1914-2003) jurisconsulto, político e historiógrafo; Irmgard Weitlaner Johnson (1914-2011), precursora en México de investigaciones sobre textiles arqueológicos e indígenas; y la colección del Museo Textil de Oaxaca, la cual está especializada en diversos aspectos del textil, como son el arte, industria, historia, diseño y conservación.
Debido a la naturaleza de las colecciones, se logró conjuntar un importante acervo especializado en filología mesoamericana, conformado por libros, publicaciones periódicas, fotografías, mapas, etc., que pueden datar del siglo xvi al xxi.

2. Diseño e implementación del repositorio digital
Debido a la importancia, antigüedad, estado de conservación y falta de organización de las colecciones, se decidió implementar un repositorio digital a través del cual se pudieran gestionar y preservar las mismas.  
“Un repositorio, depósito o archivo es un sitio web centralizado donde se almacena y mantiene información digital, habitualmente bases de datos o archivos informáticos. Pueden contener los archivos en su servidor o referenciar desde su web al alojamiento originario.” [1]
Pueden existir repositorios institucionales o de software, en este caso a los que se hace mención es a los primeros. El objetivo principal de un repositorio institucional es la organización, preservación, diseminación y acceso a los recursos que se ingresen en el mismo.

2.1. Repositorio Digital DSpace
Dspace es un software de código abierto diseñado por el Massachusetts Institute of Technology (MIT) y Hewlett-Packard (HP), utilizado para la implementación de repositorios digitales. DSpace se seleccionó entre una comparativa[2] entre Collective Access y Omeka, en la cual se tomaron en cuenta algunos aspectos como: definición del sistema, forma de búsqueda, proceso de instalación, requerimientos y actualizaciones.
Matriz de comparación
Collective Access
Dspace
Omeka
Es un repositorio digital institucional.
No tiene sistema para exposiciones virtuales.
Es un repositorio digital institucional.
No tiene sistema para exposiciones virtuales.
Es un repositorio digital institucional.
Tiene sistema para exposiciones virtuales.
El sistema de búsqueda es limitado. Sólo realiza búsquedas por palabra clave.
El sistema de búsqueda es completo. Tiene búsqueda básica y avanzada.
El sistema de búsqueda es completo. Tiene búsqueda básica y avanzada.
El proceso de instalación es complejo. Requiere instalarse por módulos.
El proceso de instalación es relativamente sencillo.

El proceso de instalación es relativamente sencillo.

No son tan frecuentes la actualizaciones del sistema.
Las actualizaciones del sistema son frecuentes y van al día.
Las actualizaciones del sistema son frecuentes y van al día.

Esto ayudó a determinar Dspace como la mejor opción, pero además también se identificaron las siguientes ventajas:
Facilidad de importación por medio del  protocolo de interoperabilidad OAI. En el caso de la BIJC, se utiliza KOHA como sistema integrador de Bibliotecas, el cual cuenta con OAI para exponer los datos, y poder ser importados de forma automática en DSpace, sin embargo, debido a que actualmente el repositorio requiere de colecciones específicas y la importación por OAI no permite ser selectiva, no se puede utilizar OAI para la importación, aunque si funciona para exponer la información por medio de éste protocolo.
Dspace utiliza SOLR como motor de búsqueda, el cual es conocido por su gran velocidad para gestionar alto volumen de información una vez indexado el contenido.
Otro factor importante para la decisión fue el manejo del sistema, para lo cual consideramos la instalación, actualización y optimización.
DSpace comparativamente es mejor, ya que utiliza un gestor de proyectos en Java, el cual permite realizar los puntos anteriores de una manera fácil y rápida.
Además, es un sistema OpenSource, lo cual facilita enormemente el proceso tanto de implementación, ya que no tiene costo, así como de administración y optimización, gracias a la gran comunidad que este software tiene.

2.2. Diseño e Implementación
El proceso de diseño e implementación del sistema se llevó a cabo en las siguientes etapas:
Etapa I. Investigación preliminar: Esta etapa se enfocó en recabar información relevante para el desarrollo del proyecto. Se identificaron los principales involucrados, los cuales se dividen en 2 grupos, el primero, el personal de la BIJC y el segundo, los investigadores, profesores y estudiantes, que acuden a la BIJC. A partir de los grupos se trabajaron las necesidades de la biblioteca.
Etapa II. Instalación: El proceso de instalación de Dspace se realizó Identificando el servidor para albergar el sistema, y se optó por utilizar un servidor OSX con un entorno operativo basado en Unix, posteriormente se descargó del software directamente del sitio oficial de Dspace, instaló Java 7,  instaló y configuró Tomcat, y el servidor de Bases de Datos PostgreSQL. Para la infraestructura se determinó que para garantizar la preservación del servidor OSX que alberga el repositorio digital, este se ubicaría en el Site, mismo que cuenta con las condiciones adecuadas para su instalación.
Etapa III. Configuración y parametrización: Se rediseñaron las interfaces WEB, permitiendo así tener las distintas interfaces de la BIJC, incluyendo a Dspace, el portal Web y el OPAC, con una apariencia similar, se crearon comunidades y colecciones considerando las necesidades y requerimientos de la biblioteca, y de forma provisional se crearon tres comunidades para incorporar en ellas las colecciones digitales con que cuenta la biblioteca.
Etapa IV. Pruebas de usabilidad: Las respectivas pruebas de usabilidad están en proceso de aplicación y consistirá en un análisis heurístico y pruebas orientadas a tareas específicas para identificar errores en el sistema, las cuales se determinarán conforme a la naturaleza de la colección y el público objetivo. Por medio de software de pruebas de usabilidad, tal como lo es Morae, se analizarán varias tareas determinadas en casos de uso cotidianos para ésta colección.
Etapa V. Correcciones: Con las pruebas realizadas se identifican las correcciones a realizar con respecto a los requerimientos, aunque esta etapa es repetitiva, ya que el sistema siempre requiere de mejoras.
Etapa VI. Capacitación: Se impartieron 2 talleres, el primero para la catalogación en Dspace dirigido a los encargados de la organización de la información de la BIJC. Posteriormente se  impartió el taller de Administración y uso de DSpace con el objetivo de capacitar a responsables y personal adscrito a la BIJC, para administrar y operar el Gestor de Colecciones Digitales.
Etapa VII. Puesta en marcha: Una vez concluida la capacitación para la administración y uso de Dspace, se iniciaron los trabajos de catalogación.


3. Estabilización, digitalización y catalogación Colección “Irmgard Weitlaner Johnson”
La colección, especializada en el textil indígena, está conformada por un archivo fotográfico, uno biblio-hemerográfico especializado en temas antropológicos, y un archivo documental que cubre las décadas de 1930 a 1980, y contiene, entre otras cosas, las notas de campo de la investigadora.
Esta fue donada a la biblioteca en marzo del 2015, previamente, la organización ADABI de México realizó un inventario de los materiales en un archivo de excel, siendo este la única herramienta de control con la que se contaba, sin embargo debido a la importancia y valor histórico de la colección, se decidió organizarla.
Para ello, se dividió el trabajo en dos etapas. La primera (misma que se está llevando a cabo), incluye el diagnóstico, estabilización, digitalización y catalogación de la colección fotográfica y documental, así como su inclusión en un repositorio digital, teniendo como principales objetivos, la preservación, organización, acceso y difusión de los materiales.
3.1. Diagnóstico
Se llevó a cabo el diagnóstico, con la finalidad de identificar el estado de conservación del acervo y su dimensión.
A partir de este, se pudo identificar que la colección se encontraba en sus empaques originales, o en contenedores de plástico, madera o cajas de archivo, colocados en estantería y organizados de acuerdo a los criterios considerados por la propietaria.
Durante el diagnóstico se identificaron los siguientes tipos y cantidades de materiales, todos ellos en buen estado de conservación aunque no el más conveniente, por lo que la recomendación urgente fue estabilizar el material.
Resumen general de la cantidad de material fotográfico
Positivos
de pequeño formato
Folios
Mecano escritos
Y manuscritos
Foto postales
Y tarjetas
Hojas de contacto
Fragmentos y 8x10”
Negativos
en diferentes medidas
Placas
en diferentes medidas
Transparencias
Total
5616
238
127
4104
2649
1066
7871
21 671
25 %
1%
.5 %
19 %
13 %
5%
36.5 %
100%

3.2. Estabilización
El proceso de estabilización consistió en la limpieza, montaje, etiquetado, resguardo del material fotográfico en cajas especiales y registro, todos ellos con la finalidad de favorecer el estado de conservación de la colección.
Se organizó, registró e inventarió  el material según tipo de formato y  al final, se etiquetaron las cajas y se organizaron de manera ordenada en estantería.
3.3. Digitalización
Se decidió llevar a cabo la digitalización de todas las imágenes teniendo en cuenta dos objetivos: la preservación y el acceso.
Por cuestiones de preservación, se  decidió hacer un negativo digital a cada uno de los materiales en formato tiff sin compresión y en archivos monopágina, y resguardarlo en un sistema de almacenamiento RAID. A partir de las características del material, definir la calidad y resolución (espacial y tonal) de la imagen y dar mayor prioridad a los materiales frágiles, en mal estado o en riesgo.
Respecto al acceso se determinó hacer una copia de las imágenes en formato JPG, optimizadas para la web y en PDF,  y realizar copias de seguridad de estas.
Para la realización del proceso, se adquirieron escáneres especiales para fotografía, equipo de cómputo con programación adecuada y un sistema de almacenamiento.
3.4. Catalogación
Pensando en la implementación de “Dspace” como gestor de colecciones digitales, se decidió hacer uso de este último para el registro de las imágenes.
Dspace utiliza el sistema de metadatos para descripción “dublin core” formado por quince elementos, los cuales fueron considerados en su totalidad, utilizando en paralelo para la normalización de la información, las normas RDA (Resource Description and Access), SEPIADES: recommendations for cataloguing photographic collections, RCAA (Reglas de Catalogación Anglo Americanas), Library of Congress Subject Headings, el catálogo de autoridades de la biblioteca, así como el tesauro del textil y de arte y arquitectura del Getty Research Institute, estándares aplicados por la biblioteca para la descripción otros materiales.
El proceso consistió en describir la fotografía con base en la imagen impresa, identificar y documentar cada una de ellas a partir del archivo de la investigadora, vincular los registros con los materiales existentes en el acervo e incluir al registro la imagen en formato jpg, identificando los metadatos generados para la misma.

4. Mejoras en los procesos
En conjunto, los procesos por los que ha pasado la colección y la gestión de la misma con Dspace, permiten una mejor organización, control, mantenimiento, manejo, acceso, compartimiento y preservación de esta, aunque de manera individual se pueden observar, entre otras, las siguientes ventajas:

Proceso
Ventajas
Gestión de la colección
·      Control de inventario
·      Control de localización física del material
·      Identificación de la información disponible en la colección
·      Control del estado de conservación
·      Registro de movilidad de la colección
Estabilización
·      Preservación de los materiales por más tiempo
·      Identificación del estado físico de los mismos
·      Reconocimiento de materiales que requieren ser restaurados
·      Organización e identificación de existencias
Digitalización
·      Se evita el desgaste de los materiales
·      Acceso a una mayor cantidad de usuarios
·      Reducción en la manipulación del material físico
·      Utilización de los materiales para distintos fines.
·      Reducción del tiempo en la compartición de la información
Catalogación
·      Documentación de los recursos
·      Preservación del contenido intelectual
·      Posibilidad  de vincular diferentes obras sobre un mismo asunto
·      Intercambio de información a niveles nacionales o internacionales
Acceso
·      Mayor disponibilidad de los materiales
·      Mayor cantidad de usuarios tienen la posibilidad de acceder a la colección
·      Proporcionar una mayor cantidad de materiales sobre un mismo tema
·      Permite la consulta simultánea
·      Se puede acceder a materiales antiguos o en mal estado .
·      Posibilita la cooperación entre instituciones y/o investigadores

5. Conclusiones
La implementación del repositorio ha sido un trabajo multidisciplinario en donde se han mezclado profesiones, conocimientos y experiencias en diversas áreas (restauración, diseño gráfico, informática, bibliotecología, museografía y antropología), a partir de las cuales ha sido posible realizar el proyecto.
Hasta el momento no ha sido concluido en su totalidad, está pendiente la integración de más colecciones y el poder empezar a compartir el repositorio con instituciones afines, y preservar así mas colecciones.
Como objetivo a futuro se desea poder importar colecciones por medio de la funcionalidad del protocolo OAI para la importación automatizada de colecciones específicas, esto se pretende mediante el manejo de la Base de Datos de DSpace, al eliminar todos los elementos importados que no pertenezcan a la colección en cuestión.
Es importante mencionar que el implementar un repositorio digital es un trabajo que implica una considerable inversión de dinero, tiempo y trabajo; sin embargo, es mínimo, comparado con las ventajas que se pueden obtener de éste con respecto a la gestión de los materiales, pero principalmente en relación al beneficio que obtienen los usuarios. 

Bibliografía
1.    Repositorios digitales. (n.d.). [Fecha de consulta: 1 de agosto de 2015]. Disponible en: http://bibliotecabiologia.usal.es/tutoriales/catalogos-repositorios-bibliosvirtuales/repositorios_digitales.html
2.    González, H. (2015). Evaluación de repositorios de objetos digitales.


Enlace a la presentación:



[1] Repositorios digitales. (n.d.). [Fecha de consulta: 1 de agosto de 2015]. Disponible en: http://bibliotecabiologia.usal.es/tutoriales/catalogos-repositorios-bibliosvirtuales/repositorios_digitales.html
[2] González, H. (2015). Evaluación de repositorios de objetos digitales.

No hay comentarios: