Portal de Eventos, Conferencia Internacional BIREDIAL-ISTEC 2015

Tamaño de la fuente: 
Análisis de la producción institucional a partir del uso de herramientas de data visualization
Lucas Eduardo Folegotto, Marisa R. De Giusti, Ariel Jorge Lira, Gonzalo Luján Villarreal

Última modificación: 17/11/2015

Resumen


Marco

La producción intelectual académica y científica de las instituciones universitarias se genera gracias al trabajo de los docentes, investigadores y becarios en sus correspondientes unidades académicas (facultades), laboratorios, centros e institutos de I+D. Esta producción se plasma principalmente en artículos científicos, tesis de grado y de posgrado, publicaciones en congresos, libros y material de aprendizaje.

Los repositorios institucionales tienen como fin primordial la preservación y divulgación del conocimiento generado en sus instituciones, y para ello alojan y exponen estos materiales, y brindan diversos servicios a partir de ellos.

SEDICI, el repositorio institucional de la universidad Nacional de La Plata, reúne toda la producción de la UNLP y no se limita exclusivamente a documentos científicos sino que incluye también trabajos de extensión, normativas y ordenanzas, audios y videos, entre otros. Todo esto es preservado y difundido bajo licencias abiertas, promoviendo así su uso en otros ámbitos y maximizando el impacto y la visibilidad de la producción de las unidades académicas. En otras palabras, SEDICI intenta ser una ventana al mundo desde donde puede accederse a todo lo que se genera desde la UNLP, y así devolver a la sociedad parte del esfuerzo invertido en la universidad pública y gratuita.

A la fecha, el repositorio cuenta con aproximadamente 45 mil recursos, prácticamente todos ellos bajo el modelo de acceso abierto. Tanto los ítems como sus metadatos pueden accederse de diferentes formas: desde la página con un navegador web, mediante consultas por medio del protocolo OAI-PMH, o utilizando RSS/Atom, entre otras.

Cada ítem en SEDICI cuenta una gran cantidad de metadatos (en total hay más de 60, aunque no todos se aplican a todos los ítems, ya que esto depende de su tipo, formato, etc). Entre estos metadatos, se considerarán para este trabajo aquellos que brindan información útil para establecer relaciones plausibles de ser analizadas: año de publicación, área temática, unidad académica, tipo de material, etc; como además los metadatos normalizados que pueden brindar datos adicionales a la hora de mostrar la información al usuario: “idioma” y “texto completo” (fulltext, boolean). Objetivo

A partir del contenido del repositorio SEDICI, se propone generar una visualización que permita analizar el volumen, alcance e impacto de la producción científica de la universidad. Entre otras cosas se buscará encontrar la mejor manera de evidenciar las cantidades de material por unidad académica, destacando aquellas que aporten mayor volumen de material en acceso abierto y a texto completo, y la cantidad de visitas por unidad académica, para evaluar cuáles tienen mayor impacto en la visibilidad de la UNLP.

Es por esto que se consideró como objetivo interpretar cuál es el alcance de la producción de ese conocimiento a los fines de entender más profundamente la variedad de contenidos. Por otro lado, se proveerá a los visitantes del repositorio una herramienta de visualización que les permita lograr una idea del volumen, tipología y heterogeneidad de contenidos albergados en el mismo.

Una vez puestos en evidencia, estos datos pueden disparar diversos análisis sobre la información obtenida. Resulta en particular relevante la posibilidad de visualizar las relaciones entre las diversas unidades académicas con sus contenidos en el repositorio (áreas temáticas que abarcan, tipos de ítems), así como también evidenciar la evolución en el tiempo de estas interrelaciones.

Metodología

Filtrado
Los datos crudos deben ser filtrados a partir de:
  1. Orígen: para limitar el análisis a las UA y al rectorado. En consecuencia, se excluirán colegios, así como también instituciones externas vinculadas a la UNLP

  2. Tipo: para acotar el análisis producción científico-académica textual: libros, tesis y tesinas, artículos, trabajos en congresos. Se excluirán, audios, objetos de museos, etc.

Este filtrado inicial puede verse modificado más adelante, en caso de considerar importante incluir datos provenientes desde otras instituciones o ampliar el alcance temporal.

Normalización

A cada recurso será necesario aplicarle algunas transformaciones o adicionarle información a fin de:

  1. Determinar la pertenencia de los autores a una UID

  2. Asignar UA a los trabajos, a partir de las UID (en muchos casos este dato ya está, pero no en todos)

  3. Determinar cuándo un trabajo pertenece a más de una UA (en principio, a partir del origen de las UIDs)

Implementación

Se analizará la teoría en lo relativo a criterios de diseño aplicado a visualización de datos complejos, así como también las posibilidades que ofrecen las nuevas tecnologías en esta materia. Se seleccionarán y adaptarán los recursos y modalidades más adecuadas y finalmente se buscará una implementación de los resultados de este relevamiento con tecnologías web HTML5, CSS3 y Javascript.


Para poder ver los trabajos, es necesario registrarse en la conferencia