1.1. Introducción¶
Los datos de investigación, entendidos como aquellos recursos documentales (evidencia) generados o recopilados durante el desarrollo de un proyecto de investigación, requieren ser gestionados en sistemas de información especializados conocidos como Repositorios de Datos de Investigación (RDI).
Los Repositorios de Datos de Investigación (RDI) son sistemas de información desarrollados para organizar, almacenar, publicar datos de investigación, con el fin de potenciar su descubrimiento, acceso, uso y reutilización a largo plazo para las máquinas y los seres humanos.
Dichos sistemas toman como insumo los datos de investigación y los transforman en objetos digitales compuestos y heterogéneos denominados DataSets que son representados como un contenedor que agrupa: Archivos de Datos(DataFiles), Documentación, Metadatos, Identificadores persistentes y Código/Scripts para su manipulación. “Los datasets se almacenan y gestionan en repositorios interoperables en red integrados en una infraestructura global de investigación, desarrollados conforme a estándares internacionales” (Grupo de Trabajo de “Depósito y Gestión de datos en Acceso Abierto” del proyecto RECOLECTA, 2012).
Los Repositorios de Datos de Investigación son implementados con base a tres principios fundamentales:
- Administración: Incluye los componentes de adquisición, organización/clasificación, almacenamiento y publicación de Datos y DataSets.
- Preservación: Incluye la selección de formatos de archivo estandarizados (ISO, NISO), copias de seguridad, cifrado y verificación de firmas de archivos (HASH), migración entre sistemas, formatos y soportes, entre otros.
- Descubrimiento: Incluye los componentes de licenciamiento, búsqueda, recuperación, acceso, visibilidad e impacto.
La utilización de metadatos normalizados son un componente fundamental en la gestión de los repositorios de datos de investigación, permiten establecer un marco común de descripción de los recursos que puedan ser entendidos y procesados por máquinas y humanos y de esta forma garantizar la reutilización de los datos y promover su validación, verificación, reproducción y certificación.
Con este fin, se desarrollaron las “Directrices de Metadatos para Repositorios de Datos de Investigación de la Red Colombiana de Información Científica (RedCol)”, buscado ofrecer a los administradores de los repositorios de datos de investigación, una guía detallada sobre los estándares, elementos de descripción y alcance de los campos de metadatos para su configuración e implementación.
Estas directrices se complementan con el documento: “Gestión de Datos de Investigación - Definiciones y Conceptos Básicos”, el cual busca aclarar y comprender qué son los datos de investigación, cómo se generan, gestionan, utilizan, entre otros aspectos, así, como el documento: “Gestión de Datos de Investigación - Diseño de un Plan de Gestión de Datos de Investigación (PGD)”, el cual tiene como propósito orientar a los investigadores en su construcción; el PGD permite describir las tareas asociadas a la gestión de datos de investigación que se realizan durante todo el proyecto, además, están asociadas a cada una de las fases del ciclo de vida de los datos de investigación.
Este documento se creó a partir de las directrices OPENAIRE para la gestión de Archivos de Datos OpenAIRE (Guidelines for Data Archives https://guidelines.openaire.eu/en/latest/data/index.html) y el esquema de metadatos de DataCite, versión 4.4 desarrollado por el consorcio DataCite (https://schema.datacite.org/meta/kernel-4.4/):
- OpenAIRE tiene como misión realizar acciones con el objetivo de “generar cambios positivos en la comunicación académica a fin de facilitar formas innovadoras de comunicar y monitorear la investigación” y lo realiza a través de alinear políticas, proporcionar servicios para ciencia abierta, vincular a las investigaciones y sus datos con sus creadores, monitorear la Ciencia Abierta; trabajar para desarrollarla y construir puentes globales, impulsando la innovación abierta para la comunicación académica”(Red Federada de Repositorios Institucionales de Publicaciones Científicas, LA Referencia, 2021).
- DataCite es una organización internacional sin fines de lucro que tiene como objetivo mejorar la visibilidad y citación de datos para: “establecer un acceso más fácil a los datos de investigación en Internet, aumentar la aceptación de los datos de la investigación como contribuciones legítimas y citables al registro académico, apoyar el archivo de datos que permitirá verificar los resultados y reutilizarlos para estudios futuros”(DataCite Consortium, 2021).