Portal de Eventos, Conferencia Internacional BIREDIAL-ISTEC 2015

Tamaño de la fuente: 
Integración de Repositorios de Acceso Abierto del Ecuador a través de un enfoque de Web Semántica
Nelson Oswaldo Piedra, Janneth Chicaiza, Pricila Quichimbo, Víctor Saquicela, Elizabeth Cadme, Jorge López

Última modificación: 16/11/2015

Resumen


Palabras clave.- Repositorios Digitales, Datos Enlazados, Web Semántica, RDF, OAI-PMH

Keywords.- Digital Libraries, Linked Data, Semantic Web, RDF, OAI-PMH

Resumen

En los primeros días de la Web, las cosas eran fascinantes y nuevas, los usuarios estaban emocionados con poder navegar por sitios que ofrecían grandes colecciones de documentos hiper-enlazados. Inicialmente esto fluía unidireccionalmente, los proveedores de contenido cargaban contenidos Web, en su mayoría contenidos estáticos, y los usuarios accedían a esta información y la usaban en una variedad de vías. Hoy, la Web se ha vuelto mucho más interactiva. Hay nuevas expectativas acerca de como consumir la ingente cantidad de contenidos disponible, se esperan mejoras sustanciales en las funciones de búsqueda de información, hay necesidad de aplicaciones que integren información diversa, y de que el contenido Web sea útil en la toma de decisiones.

Estas expectativas dejan ver algunas cuestiones críticas en la Web. La mayoría del contenido Web está diseñado en formatos entendible por los seres humanos, y no para que los programas de computación puedan manipular de manera fiable la semántica de este contenido. El actual enfoque de Web Semántica busca incorporar estructuras semánticas (esto es dotar a la información de significados bien definidos) a la información de las páginas Web, de manera que se construya un entorno en el que los agentes software pueden ejecutar colaborativamente tareas de procesamiento sobre los datos que actualmente se limitan a mostrar.

Internet genera un escenario global en el que las condiciones de interoperabilidad (IEEE, 1990) son las que garantizan el descubrimiento, la distribución y re-uso de recursos digitales, más allá de condiciones de gestión local, de modelos tecnológicos y de herramientas de cualquier tipo. Para lograr la interoperabilidad entre repositorios de librerías digitales, la Iniciativa de Archivos Abiertos (OAI, 2015) propone el protocolo para la recolección de metadatos denominado OAI-PMH. Este protocolo se basa en estándares abiertos, lo que garantiza un cierto nivel de interoperabilidad automática entre emisores y receptores de recursos digitales, con independencia del software utilizado e incentivando la neutralidad tecnológica y la innovación. Aunque OAI-PMH facilita el intercambio de metadatos en la Web, esta aproximación no es suficiente para asegurar la integración de repositorios. Fundamentalmente porque en un entorno abierto como la Web, no es posible estandarizar los procesos de descripción y publicación de metadatos. Cada institución maneja diferentes formatos de datos o esquemas de metadatos o vocabularios.

En este trabajo se plantea una vía para mejorar la integración de información sobre repositorios digitales abiertos usando un enfoque de Web Semántica. Este enfoque puede ser entendido como el conjunto de tecnologías y estándares que agregan una nueva capa a la infraestructura de la Web actual, con el objetivo de crear una Web en la que sea posible la integración automática de datos a escala global.

Materiales y metodología.

Para asegurar la integración de Repositorios de Acceso Abierto del Ecuador, en este trabajo, se han aplicado las tecnologías de la Web Semántica (Gendt y otros, 2006) y se ha adoptado un proceso de publicación de datos enlazados siguiendo los principios definidos por el propio inventor de la Web, Berners-Lee (2006).

Mediante tecnologías de la Web Semántica, se busca añadir a los repositorios digitales actuales, significados comprensibles (o "semántica") en formatos procesables automáticamente por agentes máquina. Un escenario de integración hace posible la combinación de recursos de información existentes en repositorios heterogéneos, distribuidos a través de la Web, y proporciona al usuario una vista unificada. Para conseguir este propósito, primero se deben resolver problemas de heterogeneidad a nivel de: (a) repositorios, (b) formatos de datos, (c) esquemas de metadatos, y (d) vocabularios o diccionarios de datos. Para abordar cada una de estas dimensiones, existen diferentes propuestas. El grado más bajo de interoperabilidad (a nivel de repositorios) se consigue con protocolos como OAI-PMH, el cual facilita la extracción e intercambio de metadatos, aunque su uso no asegura el re-uso e integración de la información. Para asegurar la interoperabilidad semántica entre diferentes repositorios se propone el uso de ontologías que permitan crear enlaces entre objetos equivalentes. En este sentido, el uso de vocabularios abiertos y la generación de datos abiertos en formatos legibles para máquinas, son claves en la integración de elementos de diferentes repositorios, más allá de estándares y acuerdos previos entre los proveedores.

Resultados parciales y finales.

El enfoque propuesto ha sido aplicado al contenido compartido a través de los repositorios digitales que forman parte de la Red de Repositorios de Acceso Abierto del Ecuador (RRAAE), siguiendo los principios de Linked Data y el ciclo de vida para la publicación de datos enlazados (Piedra y otros, 2015). De forma concreta, como resultado del presente proyecto, se ha generado un dataset de metadatos de recursos digitales, en formato RDF, los mismos que pueden ser consultados y utilizados con diferentes fines.

La RRAAE es el nodo nacional que forma parte de la Red Federal de Repositorios Institucionales de Publicaciones Científicas de Latinoamérica – La Referencia. Avanzar en esta vía contribuye en la creación de un entorno federado consistente y eficiente en el que se mejora la reutilización externa y la compartición de recursos digitales.

Conclusiones.

En este trabajo se ha presentado la experiencia obtenida al publicar lo metadatos de de repositorios digitales de instituciones ecuatorianas; las actividades desarrolladas aseguran la reproducibilidad del ciclo de publicación de datos enlazados sobre cualquier otro repositorio OAI.

Con el objetivo de seguir contribuyendo a mejorar la visibilidad y acceso a los materiales digitales que se usan o generan en el ámbito académico y científico, los autores siguen diseñando servicios que explotan el potencial de los datos enlazados. De forma específica, se están explorando otras redes de repositorios federados de Latinoamérica, con el objetivo de conformar un hub central que proporcione información integrada de las obras y líneas de trabajo de cada institución de la región; además está en construcción un buscador semántico basado en facetas, que permita la exploración de contenido a través de categorías que han sido asociadas a los recursos. Este tipo de navegación permite especificar filtros sobre distintos atributos de los documentos y así cualquier usuario podrá encontrar más fácilmente recursos relevantes.

Bibliografía.

Berners-Lee, Tim (2006). Linked Data-Design Issues. Obtenido de: http://www.w3.org/DesignIssues/LinkedData.html.

Gendt, M.; Isaac, A.; Meij, L. & Schlobach, S. (2006). Semantic Web Techniques for Multiple Views on Heterogeneous Collections: A Case Study. Research and Advanced Technology for Digital Libraries. Springer Berling Heidelberg, vol. 4172.

IEEE (1990). IEEE Standard Glossary of Software Engineering Terminology. IEEE Standards Board, New York.

OAI (2015). The Open Arvhives Initiative Protocolo for Metadata Harvesting, Implementation GuideLines. Obtenido de: http://www.openarchives.org/OAI/openarchivesprotocol.html.

Piedra, N. Tovar, E. López, J. Chicaiza, J. (2015). Revista Ibérica de Sistemas y Tecnologías de Información (RISTI), 3.


Para poder ver los trabajos, es necesario registrarse en la conferencia