Ir al contenido principal

RIUMA : Repositorio Institucional de la Universidad de Málaga: Descripción y depósito de los datos

En esta guía encontrará información útil para saber qué es y cómo utilizar RIUMA.

Descripción de los datos de investigación

En esta fase se incorporan los metadatos de los datos de investigación a partir de los cuales el usuario podrá recuperarlos. Antes de comenzar con la descripción del dataset hay que asegurarse de que se hace el envío a la colección correcta, en este caso, datos de investigación.

Durante todo el proceso de envío, se mostrará en la parte superior de la página un diagrama que refleja los pasos a seguir a lo largo del procedimiento de depósito (la fase en que se encuentra el proceso aparece activada dentro del diagrama)

Una vez comenzado el envío aparecerá un desplegable para seleccionar el tipo de documento. Es muy importante que seleccionemos Dataset para poder realizar la descripción de forma correcta:

 

  • Autor: se introducen los apellidos y el nombre del autor del documento. Si hubiera más de un autor, seleccionar el botón Añadir. En caso de que el trabajo se haya realizado en colaboración, deben hacerse constar todos los autores, a los que previamente se les habrá pedido permiso. Se introducirá el nombre completo del autor o autora con los dos apellidos, y en caso de que contengan preposición o artículo estas se consignarán formando parte de los apellidos de la forma que se indica.

  • Título: escriba el título principal del ítem. Es muy importante asignar un título unívoco al dataset que se está describiendo y evitar, por ejemplo, asignarle el mismo título que el del artículo científico con el que se asocia, o con el proyecto al que pertenece.
  • Título alternativo: si el ítem tiene títulos alternativos, por ejemplo el título en otro idioma.
  • Fecha de publicación: escriba la fecha de depósito en RIUMA completa.
  • Año de publicación: escriba solamente el año en que se publica.
  • Fecha de creación del recurso: escriba el año en el que se creó el recurso.
  • Grupos de investigación: rellene con el nombre de los grupos de investigación que han participado en la elaboración del dataset.
  • Departamentos: seleccione todos los departamentos que han participado en la elaboración del dataset, para ello mantenga pulsada la tecla Ctrl mientras los selecciona.
  • Centro: seleccione del desplegable la Facultad o Escuela correspondiente.
  • Editorial: Indique el nombre de la editorial. Si carece de editorial entonces se consigna Universidad de Málaga en este campo.
  • Cobertura espacial: hace referencia al lugar de recogida de datos o al lugar al que hacen referencia los datos.
  • Cobertura temporal: hace referencia al periodo que cubre el dataset o el periodo de recogida de datos.
  • Cita: existen elementos mínimos obligatorios y otros recomendados que se combinan para elaborar la cita en cualquier estilo estándar (ALA, MLA, Chicago, etc.) o los propuestos por los principales repositorios de datos (Dataverse, Dryad, etc.). Conoce más sobre la cita de datos de investigación.
    •     Obligatorios: autor(es), fecha, título, identificador único persistente, tipo de recurso, versión y/o edición.
    •     Recomendados: identificador de autor, repositorio de datos, publicación, productor, ámbito geográfico, ámbito temporal.
  • Identificadores: si el ítem tiene algún número o código de identificación, por favor seleccione su tipo e ingréselo.
  • Nº de versión: Introduzca el número de versión, ej. 1.0.
  • Tipo: seleccionar DATASET.
  • Idioma: escriba el lenguaje del contenido principal del ítem. Si el contenido no tiene un idioma (por ejemplo, si es una imagen) ponga 'N/A'.
  • Rights: la opción elegida será como norma general 'info:eu-repo/semantics/openAccess'. Si necesita embargar los datos de investigación ha de justificarlo en el campo "Descripción".
  • Palabras clave: introduzca todas las palabras clave o materias necesarias para identificar el contenido de su documento. Deben incluirse de forma individual, para ello debe pulsar el botón Añadir. Se recomienda usar entradas procedentes de un vocabulario controlado. Ejemplos: entradas de Library of Congress Subject Headings (LCSH), Library of Congress Classification (LCC), Medical Subject Headings (MESH), Dewey Decimal Classification (DDC) ó el Catálogo de Autoridades de la Red de Bibliotecas y Archivos del CSIC.

  • Resumen: Resuma de los objetivos y conclusiones de la investigación realizada. Suele recoger la motivación del proyecto, el resumen del contenido del dataset y su estructura, así como su metodología y proceso de validación. Se aceptan hasta 2.000 caracteres.
  • Está basado en: indique si el conjunto de datos es la versión de un conjunto de datos precedente.  Debe incluirse la URI del dataset previo o en su defecto, la citación bibliográfica de un dataset asociado precedente.
  • Es parte de: indique si el conjunto de datos forma parte de otro.
  • Está referenciado por: referencie los trabajos (por ejemplo, artículos) que mencionan el conjunto de datos. Deben incluir como mínimo los siguientes datos: Apellido, Nombre. Título. Handle y/o DOI.
  • Patrocinadores: indique los nombres de los patrocinadores y/o los códigos de financiación.
  • Descripción: introduzca cualquier otra información o comentario que considere de interés para la descripción del documento. Si su conjunto de datos de investigación tiene límites al acceso abierto(1) hágalo constar en este campo y, además, debe justificar el porqué se tiene que limitar el acceso. Los límite al acceso abierto son los siguientes:
    • Protección de información personal (GDPR)
    • Leyes de confidencialidad
    • Protección de especies en peligro
    • Protección de recursos culturales
    • Protección de recursos genéticos
    • Periodos de uso exclusivo de datos de investigación

 (1) Bernal, I., 2019. Marco legal, licencias, políticas y buenas prácticas en la gestión de datos de investigación. [online] Digital.csic.es. Disponible en: https://digital.csic.es/bitstream/10261/200460/1/Copyright_DataScience_Bernal.pdf
[Acceso 28 abril 2021].

Antes de proceder con la carga de ficheros es importante asegurarse de que LOS DATOS PERSONALES Y SENSIBLES ESTÉN ANONIMIZADOS.

Estas son las opciones que se ofrecen en la pantalla Subir fichero:

  • Fichero : pulsando el botón Examinar navegaremos a través de los directorios y carpetas de nuestro equipo hasta localizar el dataset y el fichero readme.txt.
  • Descripción del fichero: opcionalmente puede indicar una descripción breve del archivo, por ejemplo: dataset, fichero readme. Es especialmente útil si el registro tiene más de un fichero adjunto.

Para depositar más de un fichero, seleccione el botón Subir fichero y añadir otro más y vuelva a repetir el proceso. Cuando se ha terminado de cargar todos los archivos, seleccione Siguiente para continuar, Anterior para volver a la página anterior, o Guardar / Cancelar para guardar la información introducida o cancelar el envío.

 

 

 

Los datos deben publicarse con una licencia Creative Commons lo más abierta posible. Para facilitar su reutilización según los principios FAIR, como establecen tanto la Ley 14/2011, de 1 de junio, de la Ciencia, la Tecnología y la Innovación, como los mandatos a nivel europeo, quedan excluidas las licencias que no permitan la creación de obras derivadas. La licencia asignada debe ser la menos restrictiva, se recomienda CC BY (permitir uso comercial y permitir modificaciones), CC BY-NC-SA (No comercial, compartir igual) o CC BY-SA (Compartir igual).

 

El último paso en el procedimiento de envío es obligatorio y consiste en conceder la Licencia de distribución a la Universidad de Málaga.

 

 

Una vez aprobado el envío de los datos de investigación se envía un correo automático con el handle del ítem. Unos días después, se genera también un DOI, que se puede consultar en el registro breve del ítem.

Depósito de los datos de investigación

 

Es importante leer la información que se incluye a continuación, para garantizar la calidad de la descripción, tanto de la estructura del conjunto de datos como de sus contenidos.
FICHEROS a incluir:

  •  Plantilla para fichero readme.txt .  El autor del conjunto de datos debe incluir obligatoriamente, además de los datos propiamente dichos, un archivo con información que describa los datos en profundidad; esta documentación se incluirá como información suplementaria en un readmefile en formato (.txt), preferiblemente en inglés. Especialmente relevante es la descripción de la metodología en que se ha basado la generación de los datos y de las variables asociadas a los datos, debido a que sin ellas la reutilización del dataset podría ser limitada.En estos enlaces tiene dos ejemplos : Digital.CSIC , Zenodo
  •   El dataset (Véase: ¿Qué son los datos de investigación?; Formatos recomendados). El tamaño máximo soportado por RIUMA actualmente es de 2 GB.


REQUISITOS que se deben cumplir para el depósito de datos de investigación:

  • Deben ser producidos por la comunidad científica de la Universidad de Málaga.
  • Tienen que poderse distribuir públicamente, en ningún caso su difusión pública podría suponer una violación legal. (Para estos casos, RIUMA permite el embargo de los dataset, con una fecha de difusión pública diferente a la fecha de depósito).
  • Los autores de los datos están obligados a conceder a la Universidad de Málaga el derecho a preservar y distribuir los datos, utilizando para ello su repositorio institucional (RIUMA).
  • En el caso de tratarse de datos de carácter personal y sensible, hay que asegurarse de que dichos datos estén correctamente anonimizados. El proceso de anonimización consiste en eliminar o reducir al mínimo los riesgos de re-identificación de los datos anonimizados, manteniendo la veracidad de los resultados del tratamiento de los mismos.
  • Los datos deben publicarse con una licencia Creative Commons lo más abierta posible. Para facilitar su reutilización según los principios FAIR, como establecen tanto la Ley 14/2011, de 1 de junio, de la Ciencia, la Tecnología y la Innovación, como los mandatos a nivel europeo, quedan excluidas las licencias que no permitan la creación de obras derivadas. Las más adecuadas son las licencias CC BY, CC 0 o equivalente.
  • Cuando la presentación de los datos sea en formato tabular (p.ej. hojas de cáculo) es imprescindible que las filas, columnas y variables aparezcan identificados con una denominación que permita reconocer a qué se refieren los datos.
  • Los conjuntos de datos pueden incluir varios ficheros.
  • Se desaconseja el envío de archivos comprimidos, excepcionalmente se aceptarán este tipo de archivos cuando el conjunto de datos que se desea depositar es demasiado grande o contiene muchos ficheros que deban distribuirse juntos. Si el tamaño del conjunto de datos impide su envío como adjunto a través del Gestor de peticiones de RIUMA, se contemplará la posibilidad de depositarlo en Consigna de la UMA.
  • Se debe incluir un fichero readmefile por dataset, preferiblemente en inglés, otra posibilidad, cuando el item está compuesto de varios dataset, es la de crear un único fichero readme que englobe todos los datasets.

PAUTAS para nombrar al fichero readme:

  • Se deberá denominar al readme file de tal manera que pueda ser asociado al dataset fácilmente; en formato plano (.txt).
  • Sí el ítem está compuesto de varios dataset y creamos un archivo readme para cada uno de ellos, estos deben estar nombrados de forma unívoca, con coherencia interna y siguiendo un mismo criterio de denominación para cada fichero. Si el ítem está compuesto de varios dataset y preferimos crear un único archivo que englobe todos, debemos asignarle un nombre significativo, es decir, que todos los dataset puedan verse reflejados en él.

CONTENIDO del fichero readme:

  • Información general sobre el o los dataset
    • Una lista del software usado para producir, representar y comprimir los datos (cuando sea aplicable).
    • La categoría de datos (crudos, procesados, visualizados…)
  • Información específica sobre el o los dataset
    • Información del artículo de revista al que hacen referencia los datos de investigación (Título, Revista y autores)
    • Metodología y enlace a publicaciones y otra documentación
    • Descripción de variables, unidades de medida, protocolos, abreviaciones, códigos o símbolos asociados a los datos.
    • Ejemplo CSIC
    • Ejemplo Zenodo

FUENTES usadas para elaborar esta plantilla:

 Oficina Técnica de DIGITAL.CSIC. Fichero Readme recomendado para software en DIGITAL.CSIC. https://digital.csic.es/handle/10261/262568
 Cornell University. Guide to writing "readme" style metadata. https://data.research.cornell.edu/content/readme#fileoverview
 Universidad de Sevilla Bibloteca. Depositar los datos. Readme.txt. https://bib.us.es/sites/bib3.us.es/files/bibinvestigacion_readme_us_v.01_3.txt

¿Tienes dudas?

Biblioteca de la Universidad de Málaga Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.