Hemeroteca digital, creación y administración

Uno de los problemas que los diarios deben enfrentar a diario es el de la conservación de sus ejemplares antiguos. Los altos costos que significan el traspaso de las colecciones a soportes más durables, como microfilms o digital, es un enorme escollo para llevar adelante la digitalización de estos archivos, muchas veces centenarios.
Sin embargo, en los últimos años el ingreso generalizado de la informática en las redacciones y secciones de armado de los diarios comienza a acortar esa brecha. Las páginas de los diarios son armadas con softwares como Page Maker y se pueden guardar fácilmente en formato PDF.
Este formato permiten realizar búsquedas de texto dentro de las páginas y leerlas en distintos dispositivos (computadoras, notebooks, etc.). Además, se lo puede transformar en texto plano con facilidad, lo que permite a los periodistas contar con todas las notas publicadas al alcance de la mano y un fácil acceso a los usuario de la hemeroteca.

Diagrama de trabajo para la digitalización de una hemeroteca

Digitalización de archivos antiguos
Si bien, como explicábamos anteriormente, la conversión de los nuevos ejemplares a formatos digitales se puede hacer automáticamente en el armado, el problema es convertir a PDF u otro formato digital los diarios antiguos.
Una de las opciones, tal vez no la más aconsejable, pero sí la más económica, es fotografíar las páginas de cada uno de los tomos y luego convertir los archivos fotograficos digitales (en formato JPG) a PDF. La opción más recomendable, pero tal vez económicamente inviable es el escaneado de cada uno de los tomos.
Una vez que tenemos los tomos fotografiados o escaneados en formato JPG, existen algunos programas que permiten convertir estos archivos a PDF y luego editarlos:

PDF Creator
PDF Splint and Merge, para unir o dividir PDFs
Addin PDF infoEdit, para añadir información a tus PDF

Recuperación de la información
Una vez que comenzamos a guardar los periódicos en PDF se presenta un nuevo desafío: ¿Cómo recuperar la información contenida en las páginas digitalizadas?
Si realizamos queremos realizar la búsqueda en periódicos nuevos, cuyas páginas hayan sido creadas en Page Maker y luego exportadas a PDF, la solución parece simple, ya que un buscador como Google Desktop podría realizar el trabajo. Incluso podríamos utilizar el buscador de Adobe Reader. Aunque estas dos soluciones son un poco rudimentarias.
Sin embargo, si intentamos realizar búsquedas en archivos JPG que luego fueron convertidos en PDF nos encontraremos con un problema más grave, porque Google Desktop no podrá encontrar nada, ya que no tiene texto donde buscar, sino una imagen.
Cualquiera sea la situación, lo más prolijo será indexar la información de todas las páginas digitales y crear un catálogo que nos permita acceder fácilmente a la página archivo PDF donde se encuentra la información buscada.
Surge entonces la necesidad de utilizar software especializado:

Winisis
Greenstone, software para gestión de bibliotecas
Hemerot, software para administración de hemerotecas
Google Desktop
FileCenter (Pluging para Google Desktop)
Catalis

Artículos y bibliografía
Artículo sobre bases de datos bibliográficas (Clacso)
Uso de BibTex en español
JabRef
Soluciones Para La Gestión de Datos Bibliográficos

Más Bloc de notas sobre bibliotecas digitales

Deja tu comentario

إرسال تعليق

Juan Jose Flores Weblog

نموذج الاتصال