logounam logo-avi
logouapa

Administración de Contenidos Digitales y de Bases de Datos

Presentación / Objetivo

La cantidad de información que hay en el mundo es impresionante, por ello, la forma en que se administra es muy importante. Recordemos que ya no hablamos sólo de libros o documentos que se resguardan en bibliotecas o archivos, sino de material digital cuya gestión debe contemplar los servicios y funciones necesarias para mantener, contener y permitir el acceso al paquete completo del medio que se quiere consultar, es decir, medio y metadatos, así como la información administrativa.

(s. a.) (s. f.). Base de datos [ilustración]. Tomada de http://programaenlinea.net/los-gestores-bases-datos-mas-usados/

 

Con el tiempo surgieron también las bases de datos, las cuales permitieron organizar la información y, a su vez, aportar un registro estadístico sobre almacenamiento, acceso, resúmenes de contenidos, formatos y tamaños.

Debido a lo anterior, es preciso abordar la forma en que se gestiona la información… ¡Comencemos!

Objetivo

Al término de la unidad, el alumno podrá:
• Identificar las características de la administración de contenidos digitales y de las bases de datos, a partir de la descripción de sus servicios y modelos respectivamente, para la gestión de contenidos digitales.

Contenido

Administración de la información

De acuerdo con la OAIS (Open Archival Information System), la administración de datos debe contemplar distintos servicios y funciones.

En lo que se refiere a la información técnica y de administración, los módulos de administración de las soluciones ya existentes deben contar con herramientas para conocer el contenido de sus repositorios. Por ejemplo:

DSpace usa herramientas de indexación para extraer índices con información proveniente de los paquetes API y hacer una cosecha incremental cada cierto tiempo; en Fedora, la información se almacena conforme a la norma Dublin Core, formando un archivo tipo FOXML, además de soportar búsquedas a texto completo.

 

(s. a.) (s. f.) DSpace [ilustración]. Tomada de https://commons.wikimedia.org/wiki/File:DSpace_logo.png

(s. a.) (s. f.) Fedora [ilustración]. Tomada de https://wiki.duraspace.org/display/DSP/Logos

 

Otras funciones son:

Los repositorios deberán tener funciones para controlar el acceso a su contenido, ya sea por cuestiones de derechos de autor, contenido especializado, autorización a determinados objetos e, incluso, la propia información administrativa. Éstos deben tener módulos con accesos jerárquicos, de acuerdo con los diferentes perfiles de usuario.

Para administrar estos repositorios, es necesaria la participación de usuarios con experiencia en el tema como desarrolladores o programadores. Una recomendación que hace Bradley (2007), es que los sistemas por desarrollar se distribuyan como un empaquetado único y tengan aplicaciones para una instalación sencilla paso a paso, además, que cuenten con versionador de configuración para poder regresar a un estado anterior si fuera necesario.


Existen tres tipos de usuarios, los que acceden al sistema por su contenido, los que crean contenido y los que lo administran. Aun cuando es recomendable que los administradores entiendan los procesos de digitalización y preservación, los sistemas deben contener herramientas que les ayuden a realizar dichas tareas. La administración de las cuentas de usuario no sólo se refiere a la identidad y perfil de las personas que acceden a los sistemas, por ejemplo, también hay que considerar si los repositorios trabajan bajo un esquema de pago por acceso a los contenidos, entre otras características.



 

Ahora bien, es necesario contar con un plan de preservación; el cual, de acuerdo con la OAIS, éste debe proveer recomendaciones para asegurar que la información almacenada se mantenga accesible a la comunidad de usuarios designada en el largo plazo incluso cuando el entorno computacional original se haya vuelto obsoleto.

(s. a.) (s. f.) Security [ilustración]. Tomada de http://ejcuciondeoperaciones.blogspot.mx/

Si el repositorio en cuestión está suscrito a normatividades internacionales, promoverá las futuras acciones de preservación. La mayoría de los datos contenidos en el diccionario PREMIS (2015) ya pueden mapearse en diversos esquemas.

 

Otro aspecto importante en la administración de contenidos es la tecnología de monitoreo, ésta se refiere a que los sistemas de almacenamiento deben seguir las nuevas tendencias tecnológicas (estándares, plataformas, etc.) para prevenir posibles causas de obsolescencia del sistema; por lo que los sistemas de almacenamiento deben contar con módulos que informen sobre alertas tecnológicas y estándares de datos para lograr una estrategia de preservación o migración.

En este sentido, la Biblioteca Nacional de Australia y la Asociación Australiana para Depósitos Perdurables están desarrollando el Sistema Automatizado de Notificación de Obsolescencia, que busca vigilar los formatos de archivos en depósitos digitales a partir de alertas que notifiquen a los administradores para que tomen acciones necesarias cuando un evento de este tipo se presenta.

En los sistemas automatizados que se encargan de la administración de contenidos, las bases de datos constituyen su núcleo, pues allí reside lo más valioso de todo el sistema: la información. Ésta debe estar organizada y normalizada para poder ser manipulada a través de un conjunto de programas que darán acceso en tiempo real a usuarios concurrentes con diferentes necesidades de información.

La complejidad y la robustez de un sistema dependen en gran medida de cómo se diseñe su base de datos, pues es de ella de donde obtienen cualidades elementales como son la integridad de los datos, la seguridad, el tiempo de respuesta y la concurrencia.

Base de datos

Una base de datos es un contenedor que permite almacenar la información de forma ordenada con diferentes propósitos y usos.

Por ejemplo, en una base de datos se puede almacenar información de diferentes departamentos como ventas, recursos humanos, inventarios, entre otros. El almacenamiento de la información por sí sola no tiene un valor, pero si combinamos o relacionamos la información con diferentes departamentos nos puede dar valor.

Para realizar un diseño adecuado de una base de datos se debe analizar su diseño conceptual, lógico-físico, así como la información que contendrá, lo que dará como resultado el uso de ciertos tipos de datos.

 
 

Diseño conceptual

Por medio de especificaciones del usuario, el diseñador de la base tendrá una descripción de la información a resguardar en el sistema, es decir, debe descubrir el significado de los datos que manejará encontrando con esto características en común y las relaciones que guardan entre sí.

Una vez comprendida la naturaleza y el uso que se le dará a los datos, el esquema conceptual resultante será utilizado para que el diseñador de la base de datos transmita al usuario lo que ha entendido sobre la información que se manejará.

Diseño lógico

Consiste en el análisis de los requerimientos del sistema para construir un esquema de la información a resguardar, utilizando un modelo o esquema específico como los que se muestran a continuación.

 
 

Su característica es que los datos se organizan en forma de arborescencia jerárquica. El árbol formado tiene un nodo llamado raíz (sin nodos padres) y uno o varios nodos padre que pueden tener varios hijos llamados hojas (nodo final). Su principal limitación es la incapacidad de limitar la redundancia de datos al no permitir que un nodo hoja tenga varios padres. En la siguiente figura podemos ver el modelado de la base de datos jerárquica de una terminal de autobuses.

Esquema modelo jerárquico

Está formado por colecciones de registros relacionados mediante ligas arbitrarias. Es muy similar al modelo jerárquico, pero la modificación fundamental es el concepto de nodo, pues aquí se permite que un mismo nodo tenga varios padres haciendo con esto un mayor número de arborescencias; por lo que es difícil de administrar una base de datos basada en este modelo. En la siguiente figura podemos ver el modelado de la base de datos en red de una terminal de autobuses.

Esquema modelo de red


La estructura en la que se ordena la información dentro de una base de datos es mediante tablas y campos. El objeto conceptual llamado tabla permite agrupar a la información por sus características básicas llamados campos. En la siguiente figura podemos ver el modelado de la base de datos relacional de una terminal de autobuses.

Esquema modelo relacional


Por ejemplo, para organizar a las personas de una empresa dentro de una base de datos podríamos estructurar una tabla por empleado, la cual contendría la información de cada trabajador (nombre, número de seguro social, entre otros) como un identificador único del empleado. Cada elemento recibe el nombre de campo y el conjunto de éstos por cada trabajador recibe el nombre de registro. En el ejemplo de la terminal de autobuses, una tabla puede ser la que se ve a continuación:

Esquema de tabla


 
 

Tipo de información

Los tipos de datos que se pueden almacenar son diversos y atienden a las necesidades de cada base de datos, respecto a la información que se quiere ordenar, los más comunes son de tipo numérico y tipo texto.

Conforme han evolucionado las bases de datos se han expandido los tipos de datos que pueden almacenar, por mencionar algunos, están los CLOB (character large object), utilizados para almacenar documentos y BLOB (binary large object) para almacenar una imagen o video.

Otro tipo de dato relevante es el XML, un dato jerárquico porque parte de un nodo inicial o raíz y, a su vez, puede tener “n” niveles y subniveles.

 
 

Por otro lado, de acuerdo con el tipo de procesamiento que se le dará a la información, se determina el tipo de base de datos a utilizar:

 

Base de datos dinámica OLTP (On Line Transaction Processing)

Base de datos estática OLAP (On Line Analytical Processing)

La información se modifica en tiempo real: se insertan, eliminan, modifican y consultan datos en línea durante la operación del sistema.
Un ejemplo es el sistema de un supermercado, donde se van registrando cada uno de los artículos que el cliente está comprando y a su vez el sistema va actualizando el inventario.

La información en tiempo real no es afectada, no se insertan, eliminan y tampoco se modifican datos, sólo se realizan consultas sobre los datos ya existentes para el análisis y toma de decisiones.
Este tipo de bases de datos son implementadas en Business Intelligence, o inteligencia de negocios, para mejorar el desempeño de las consultas con grandes volúmenes de información.

 
 

La necesidad de implementar un tipo u otro dependerá del giro y necesidades de cada institución; es muy importante identificar el tipo de base de datos que se requiere antes de implementar un manejador de base de datos, pero ¿qué es esto?

Un sistema manejador de base de datos (SMBD) consiste en una base de datos y un conjunto de programas para tener acceso y manipulación de los datos. Su objetivo es crear un ambiente en donde sea posible almacenar y recuperar información en forma eficiente y conveniente, sus funciones son:

  • Permitir la interacción de la base de datos con el sistema operativo.
  • Implantación de la seguridad en el acceso a la información resguardada.
  • Puesta en práctica de la integridad de los datos.
  • Respaldo y recuperación.
  • Control de la concurrencia y verificar los privilegios de los usuarios.

En un SMBD es necesario el uso del lenguaje SQL para trabajar sobre la base de datos relacional.

Existe un vasto número de manejadores de bases de datos en el mercado, tanto aplicaciones propietarias como software libre, cada una de ellas con sus ventajas y limitantes, algunos sistemas gestores de bases de datos son:

Por último, hay que considerar que cuando se crea una base de datos y se inicia su operación, el volumen de la información es mínima y el desempeño de la aplicación y base de datos es óptima, sin embargo, conforme pasa el tiempo el volumen de información incrementa y en consecuencia surgen los siguientes problemas:

  • Problemas de espacio en disco.
  • Incrementos de costo en almacenamiento y procesamiento.
  • Problemas de desempeño en las consultas.
  • Fallas en el aplicativo afectando la disponibilidad de los datos.
  • Problemas con la base de datos y la pérdida de información.

Actividad

Gestión de contenidos digitales

Una vez que el sistema de información ha recibido y almacenado objetos digitales, así como su documentación relacionada, es indispensable pensar en su administración y posteriormente en la creación de la base de datos; para lograrlo es necesario conocer qué engloba cada proceso.

A continuación identifica si las características que se mencionan de ambos procesos son verdaderas o falsas. Al finalizar podrás conocer tu desempeño.

Autoevaluación

Base de datos

Una base de datos reúne varios elementos para su diseño y correcto funcionamiento, tal es el caso del lenguaje que utiliza, su sistema manejador de datos o el tipo de base de datos que es… ¿logras identificarlos? A continuación lo averiguarás.

Fuentes de información

Básica

Bibliografía

Batini, C., Ceri, S. y Navathe, S. B. (1994). Diseño conceptual de bases de datos: un enfoque de entidades interrelacionadas. Wilmington: Addison Wesley Iberoamericana.

Bradley, K. (2007). Hacia un sistema de almacenamiento y preservación en código abierto. México: Conaculta/Fonoteca Nacional.

Date, C. J. (1993). Introducción a los sistemas de bases de datos (Vol. 1, 5.ª ed.). Wilmington: Addison Wesley Iberoamericana.

DLF. (2002). Benchmark for Faithful Digital Reproductions of Monographs and Serials. Washington D. C.: Digital Library Federation.

 

Documentos electrónicos

Anguiano, J. D. (2014). Características y tipos de bases de datos. Consultado el 04 de septiembre de 2018 de https://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

Biblioteca Nacional de España. (2015). Diccionario de datos PREMIS de Metadatos de Preservación Versión 2.0 [Versión electrónica]. Consultado el 04 de septiembre de 2018 de http://www.bne.es/media/Publicaciones/PublicacionesTecnicas/PREMIS_es.pdf

Blázquez, M. (2014). La migración de datos. Exportación e importación [Mensaje en blog]. Consultado el 04 de septiembre de 2018 de http://ccdoc-automatizacion.blogspot.mx/2014/03/la-migracion-de-datos-exportacion-e.html

DSpace. (s. f.). Cómo actualizar o importar metadata Dublin Core por bloques (Excel, CSV). Consultado el 04 de septiembre de 2018 de https://confluence.tavara.pe/DSPACEDOC5x/tutoriales-adicionales/como-actualizar-o-importar-metadata-dublin-core-por-bloques-excel-csv

Pearce-Moses, R. (2005). A glossary of archival and records terminology [Versión electrónica]. Chicago: The Society of American Archivists. Consultado el 04 de septiembre de 2018 de http://files.archivists.org/pubs/free/SAA-Glossary-2005.pdf

Rodríguez, P. O. (2016). La preservación digital sonora [Versión electrónica]. Investigación Bibliotecológica: archivonomía, bibliotecología e información, (68). México: IIBI-UNAM. Consultado el 04 de septiembre de 2018 de http://rev-ib.unam.mx/ib/index.php/ib/article/view/54601/48544

Sánchez, B. (s. f.). Curso: enfoque de sistemas (Programa de Posgrado en Ingeniería, UNAM. Departamento de Ingeniería de Sistemas). Consultado el 04 de septiembre de 2018 de http://slideplayer.es/slide/26344/

Universidad de Cornell. (2000-2003). Llevando la Teoría a la Práctica. Tutorial de Digitalización de Imágenes. Ithaca, N. Y.: Biblioteca de la Universidad de Cornell/Departamento de Investigación. Consultado el 04 de septiembre de 2018 de http://preservationtutorial.library.cornell.edu/tutorial-spanish/tutorial_Spanish.pdf

Voutssas, J. (2009). Factores tecnológicos, legales y documentales de la preservación documental digital [Versión electrónica]. Investigación Bibliotecológica. archivonomía, bibliotecología e información, 23(49). México: IIBI-UNAM. Consultado el 04 de septiembre de 2018 de http://dx.doi.org/10.22201/iibi.0187358xp.2009.49.21391

 

Sitios electrónicos

Ayuda de Open Journal Systems. (2017). Consultado el 04 de septiembre de 2018 de http://revistas.rae.es/help/view/journal/topic/000031

AMANDA Network Backup. Consultado de http://www.amanda.org/

The Bacula® Open Source Network Backup Solution. Consultado de http://blog.bacula.org/

GitHub. (s. f.). PySAF. Consultado de https://github.com/cstarcher/pysaf

Complementaria

Soler, J. (2008). La preservación de los documentos electrónicos. Barcelona: UOC.