Un framework flexible para la mejora de metadatos en repositorios institucionales con datos de OpenAIRE y OpenAlex.

Autores

DOI:

https://doi.org/10.22477/xiv.biredial.406

Palavras-chave:

Bibliometría, Repositorios institucionales, Data Warehouse, Identificadores persistentes

Resumo

Este trabajo presenta una estrategia para enriquecer y analizar los metadatos de un repositorio institucional mediante la integración de fuentes abiertas como OpenAIRE y OpenAlex. Partiendo de la premisa de que estas fuentes ofrecen perspectivas complementarias sobre la producción científica, se propone su combinación para construir una visión más integrada y enriquecida. El enfoque se basa en un modelado flexible con Data Vault, que permite una integración escalable de datos, normalizando identificadores y vinculando entidades clave.
El proceso se organiza en tres etapas: recolección, normalización e integración. Durante la recolección, se aplican filtros que permiten obtener datos pertinentes desde ambas fuentes, considerando tanto la afiliación institucional como el repositorio local. La integración cruza información, combinando métricas de impacto y visibilidad.
Se presentan resultados obtenidos para el repositorio SEDICI de la UNLP, incluyendo publicaciones enriquecidas, autores institucionales identificados y publicaciones candidatas a ser incorporadas desde OpenAlex.
Finalmente, se discute el potencial de extender esta estrategia a otras fuentes, incluyendo sistemas internos, para mejorar la cobertura y calidad de los metadatos. La propuesta promueve un uso estratégico del repositorio como herramienta de gestión, evaluación y difusión de la producción científica institucional.

Biografia do Autor

Pablo César de Albuquerque, Universidad Nacional de La Plata (UNLP); Comisión de Investigaciones Científicas (CIC), Argentina

Es Licenciado en Sistemas por la Universidad Nacional de La Plata (UNLP) y actualmente cursa el Doctorado en Ciencias Informáticas en la Facultad de Informática de la misma universidad. Desarrolla su trabajo de investigación en PREBI-SEDICI (UNLP) y en el Centro de Servicios en Gestión de Información (CESGI) de la Comisión de Investigaciones Científicas de la Provincia de Buenos Aires (CIC). Su tesis doctoral se centra en el diseño e implementación de un data warehouse académico que integre múltiples fuentes para medir la visibilidad e impacto de la producción científica institucional. Sus áreas de interés incluyen la ciencia de datos, bibliometría, repositorios digitales y la gestión de información académica.

Gonzalo Luján Villarreal, Universidad Nacional de La Plata (UNLP); Comisión de Investigaciones Científicas (CIC), Argentina

Es Doctor en Ciencias Informáticas por la Universidad Nacional de La Plata (UNLP). Actualmente se desempeña como Director de PREBI-SEDICI UNLP y Director del Centro de Servicios en Gestión de Información (CESGI) de la Comisión de Investigaciones Científicas (CIC) de la Provincia de Buenos Aires. En el ámbito académico, es docente en la Facultad de Informática de la UNLP, donde dicta cursos de programación, programación orientada a objetos y programación concurrente, así como asignaturas de posgrado relacionadas con métricas científicas y repositorios digitales. Además, es Coordinador Técnico de revistas científicas de la UNLP y responsable de la gestión de los portales de revistas, congresos, libros y del Repositorio de Datos de Investigación de la universidad. Sus intereses de investigación incluyen bibliotecas digitales, repositorios, desarrollo y ingeniería de software, y simulación de eventos discretos.

Downloads

Publicado

2025-12-15

Como Citar

Albuquerque, P. C. de, & Villarreal, G. L. (2025). Un framework flexible para la mejora de metadatos en repositorios institucionales con datos de OpenAIRE y OpenAlex. Conferência Internacional BIREDIAL-ISTEC. https://doi.org/10.22477/xiv.biredial.406

Edição

Seção

Eje temático 4: Infraestructura tecnológica

Categorias