Este breve artículo pretende ayudar a resolver las dudas más frecuentes sobre el depósito de dataset o datos de investigación, un requisito indispensable para los procesos de evaluación de la ANECA (Acreditación y Sexenios). En el caso de la UPM se podrá utilizar el repositorio E-cienciaDatos del Consorcio Madroño al que pertenece la UPM.
¿Quién puede depositar?
- Autoarchivo, cuando el propio investigador crea el dataset, tiene que solicitar un usuario a través de este formulario.
- Archivo delegado, solicitando a la biblioteca de su universidad que lo cree y gestione. Esta opción solo se utilizara en casos excepcionales, para dataset muy grandes o complejos
En ambos casos, el proceso cuenta con el asesoramiento y revisión de la biblioteca universitaria, que garantizan la calidad de los datos y su adecuación a los estándares del repositorio. El dataset será publicado por el personal de la Biblioteca una vez revisados los metadatos.
¿Qué datos se pueden depositar?
Se pueden depositar conjuntos de datos de investigación finales de cualquier disciplina.
En particular:
- Datos finales o completos, preparados para su difusión pública y reutilización.
- Datos que validen los resultados de la investigación.
- Datos incluidos en el Plan de Gestión de Datos (PGD) que sean susceptibles de compartirse al finalizar el proyecto.
Es imprescindible que los datos:
- Vayan acompañados de documentación explicativa (Readme.txt) con información sobre contenido, metodología, autoría, etc.
- Incluyan metadatos descriptivos normalizados que faciliten su comprensión y reutilización.
¿Cuándo depositar?
Los datos deben depositarse en función de su naturaleza y financiación:
- Cuando lo exija la entidad financiadora, especialmente en proyectos financiados con fondos públicos.
- Lo antes posible en el caso de datos que validen resultados de investigación y lo requiera la revista.
- Al finalizar el proyecto, para aquellos datos previstos en el Plan de Gestión de Datos que puedan hacerse públicos.
Licencias de depósito y uso
El depósito implica la aceptación de una licencia de depósito, mediante la cual se declara que:
- Los datos son originales.
- No infringen derechos de terceros.
Además, los datasets se publican bajo una licencia de uso que define las condiciones de reutilización.
Las más habituales son:
- CC0 (dominio público)
- CC‑BY (reconocimiento de autoría)
- También se podrá elegir otra licencia Creative Commons
Los datos se difunden en acceso abierto por defecto, salvo restricciones legales, éticas o de protección de datos.
¿Qué formatos de ficheros se admiten?
El repositorio admite todo tipo de formatos de archivo, aunque se recomienda:
- Utilizar formatos abiertos y no propietarios para garantizar la accesibilidad y preservación a largo plazo.
- Emplear formatos estándar ampliamente utilizados en cada disciplina.
Ejemplos recomendados:
- Datos tabulares: CSV, TSV.
- Texto: TXT, XML, PDF/A.
- Imagen: JPEG, PNG, TIFF.
- Audio: WAV, AIFF.
También se pueden subir formatos propietarios si son de uso habitual en la comunidad científica de cada disciplina.
Datos FAIR
Los datos depositados deben cumplir los principios FAIR. Es decir, ser:
- Localizables (Findable): mediante metadatos y DOI.
- Accesibles (Accessible): disponibles en acceso abierto o bajo condiciones claras.
- Interoperables (Interoperable): usando formatos y estándares que permitan su intercambio.
- Reutilizables (Reusable): con licencias claras y documentación adecuada.
Para ello, cada dataset incluye:
- Metadatos estandarizados
- Licencias de uso
- Fichero Readme.txt
- Identificador persistente (DOI)
E-cienciaDatos ha incorporado en cada registro un widget, que da información sobre el cumplimiento de la principios FAIR utilizando F-UJI - Automated FAIR Data Assessment Tool.
- Asignación de DOI para identificación y citación del dataset.
- Citas normalizadas para facilitar el reconocimiento académico.
- Cumplimiento de requisitos de OpenAIRE, Horizonte 2020 y Horizonte Europa.
- Asesoramiento por parte de la biblioteca.
- Estadísticas de uso y descarga y herramientas de geolocalización.
- Exportación de metadatos en formatos compatibles con gestores bibliográficos.
- Control de versiones y preservación a largo plazo en un repositorio certificado (CoreTrustSeal).
Fuentes consultadas
- Guía para el depósito/autoarchivo de Datasets en E-cienciaDatos
- Guía de uso de Eciencia-Datos
- Plan de Preservación de e-cienciaDatos
- Difunde tus datos de investigación en e-cienciaDatos (Infografía-Madroño)
- El ciclo de los datos científicos (Infografía-REIBUN)
- Práctica Open Science (Infografía-Madroño)
Relacionada con