miércoles, 27 de julio de 2016

La digitalización masiva de documentos con medios del siglo XXI

                                         
Quizá la pregunta más habitual que nos podamos hacer al considerar la digitalización masiva de documentos de un archivo sea esta: “¿cómo puedo digitalizar la enorme cantidad de documentos que tengo en formato papel de una forma rápida y eficiente?”.
Cuando se trata de un volumen realmente grande, quien contemple la gestión de documentos o el archivo electrónico de papel debe enfrentarse a esta pregunta y debe buscar la solución que mejor se adapte a sus circunstancias.

Procesos de digitalización

La clave está en la respuesta a esta pregunta: para llevar a cabo la digitalización, ¿es mejor dotarnos de los medios técnicos y humanos apropiados o contratar a una empresa especializada en digitalización masiva de documentos? Dependiendo del tamaño y especialidad de nuestra Organización, nos interesará más una opción u otra.
Existen muchos aspectos a considerar antes de comenzar a diseñar un proceso de digitalización masiva de documentos, que podríamos resumir en:
  • Preparación y digitalización
  • Clasificación e indexación
  • Almacenamiento y consulta

Preparación y digitalización de los documentos

Este proceso implica un análisis completo de los documentos existentes y de los procesos necesarios para que estos se puedan digitalizar. Es el momento más crítico del proceso y el que más tiempo consume.

La extracción de los documentos de las carpetas, la eliminación de grapas, clips, notas pegadas, post-it, y la limpieza general del documento se produce durante esta etapa. Una vez analizados los documentos a capturar, se deberían poder responder las siguientes preguntas:
¿Cuál es el tamaño de los documentos? ¿Son todos DIN A4, o algunos son mayores o menores? ¿Están a simple cara o a doble cara? ¿Cuál es la proporción de cada tipo?
Determinar estos aspectos ayuda en la elección de los dispositivos necesarios para llevar a cabo el trabajo: escáner con alimentador manual o automático, de simple o doble cara, etc.


El escáner elegido debería tener la capacidad de digitalizar todo su rango de tamaños soportados sin necesidad de cambiar los parámetros del escáner. Deben tenerse en cuenta escáneres especiales para necesidades especiales, como pequeñas tarjetas de visita o grandes planos de AutoCAD.

¿Cuáles son las características de los documentos? ¿Están en blanco y negro, o en color? ¿Tienen zonas resaltadas, marcadas, escritas a mano o con tinta?
Estas preguntas ayudarán a decidir si se necesita un proceso de mejora de las imágenes por parte del propio escáner o si se necesita añadir algún software al mismo.


Sin este proceso de mejora para los papeles de color, para las anotaciones manuales y otras características similares del documento, podrían generarse resultados de poca calidad e imágenes inútiles (demasiado oscuras o claras, con demasiados puntos, con poco contraste, etc.)

¿Son todos los documentos del mismo tipo, tales como facturas, albaranes u órdenes de compra, o son de tipo mixto, como historias clínicas o documentos de recursos humanos?
Esto ayudará a determinar el modo de clasificar los documentos antes del proceso de digitalización. Si fueran todos del mismo tipo, se pueden digitalizar por lotes mediante la categorización de documentos. Si son de tipo mixto, se tendrán que preparar para ser categorizados además a nivel de carpeta. Esta categorización es conocida como separación de documentos.


A medida que se digitalizan los documentos, el software de captura debe determinar nuevas categorías y direccionarlos a distintas carpetas en función de páginas separadoras. Para este cometido se utilizan páginas en blanco, páginas con códigos de barras o etiquetas, patrones comunes o números predeterminados de páginas.

¿Se necesita buscar por el texto de los documentos una vez almacenados? Si es así, ¿cuál es la calidad de los mismos? ¿Provienen de impresoras láser, impresoras matriciales o de máquinas fax? ¿Los hay manuscritos?
La búsqueda por el texto contenido en una imagen digitalizada requiere de un proceso previo de OCR (Optical Character Recognition o Reconocimiento Óptico de Caracteres). Una buena calidad de la imagen será muy importante para obtener los mejores resultados.


Una vez obtenido el texto, se puede fundir con la imagen en un fichero PDF de doble capa que permita a cualquier motor de indexación Full Text (texto completo) indexar todas las cadenas de texto obtenidas y utilizarlo para localizar facilmente el documento.

Clasificación e indexación de los documentos

La indexación de los documentos es imprescindible para que su localización, una vez convertidos a formato electrónico, sea sencilla y efectiva.
Los parámetros de indexación se pueden determinar una vez respondida la siguiente pregunta: ¿qué información utilizaría yo para buscar este documento rápidamente? Simplificando mucho, se puede pensar en indexar un documento por un “Título”, y añadirle después otros campos clave de tipo texto, fecha o numérico, para poder localizarlo de una forma sencilla dentro del sistema de Gestión Documental.
El software de captura debe incorporar opciones de indexación tales como introducción manual de los datos, desplegables para incorporar valores fijos, conexiones con bases de datos externas para rellenar campos de forma automática, OCR para la indexación automática de ciertas zonas de la imagen, lectura de códigos de barras y opciones de arrastrar/soltar texto desde la imagen.

Almacenamiento y consulta de los documentos

Ahora que ya nos hemos quitado de encima el problema del papel, debemos decidir en que plataforma lo vamos a poner a disposición de los usuarios que necesitan consultarlo: ¿en un sistema de gestión documental dentro de nuestra Organización o en la nube?
La nube está en todas partes, y todos conocemos sus enormes ventajas. Pero, ¿qué significa el concepto de nube para aquellos profesionales que quieren dejar de usar el papel? ¿Qué debe considerar el propietario de un negocio o el responsable de IT de una Organización cuando decide colocar sus papeles en la nube?

Sistemas propios

Son sistemas en los que se instala un sistema de gestión de documentos en la propia infraestructura de la Organización. Son ideales para PYMES que dispongan de soporte de IT y servidores de backup. también son una buena opción para aquellas organizaciones que no se encuentren cómodas almacenando datos sensibles en la nube o que están esperando a comprobar lo fiables que son en realidad estos sistemas. Un ejemplo de estos sistemas seríaOpenText Document Server Alchemy.

Sistemas en la nube

Estos sistemas tienen algunas ventajas sobre los sistemas locales: menores costes en infraestructuras, un despliegue de la solución más rápido, olvidarse del backup, un tiempo de recuperación ante desastres mucho menor y acceso a los documentos desde múltiples puntos remotos.

Evaluación final

En cualquiera de los dos casos, hay tres grandes beneficios en gestionar los documentos de forma electrónica: incremento de la eficiencia, aumento de la seguridad y accesibilidad inmediata.

Conclusión

La clave para implementar con éxito una solución de digitalización comienza en la etapa de planificación. Son aspectos vitales del proceso: el conocimiento de los tipos de documentos a digitalizar, los requerimientos de hardware, los métodos de indexación disponibles y un plazo de tiempo realista para llevar a cabo la conversión del papel a ficheros digitales.
Si no se revisa minuciosamente el archivo físico de papel y no se entiende el nivel de esfuerzo necesario para preparar los documentos, los resultados pueden ser decepcionantes. En caso de no disponer de los conocimientos y/o los recursos adecuados, siempre habrá profesionales dispuestos a ayudarle con el proceso completo.
Fuente: http://www.sdm.es/como-abordar-la-digitalizacion-masiva-de-papel/


No hay comentarios: