¿Qué es Dataverse?

Foto de Nong V en Unsplash

Dataverse es una plataforma de código abierto desarrollada por la Universidad de Harvard que permite a investigadores y organizaciones compartir, preservar y citar datos de investigación de manera fácil y efectiva. Dataverse proporciona herramientas para almacenar, publicar y compartir datos en una variedad de disciplinas académicas, lo que permite a los investigadores compartir sus datos de manera efectiva y aumentar el impacto de sus investigaciones.

Además, Dataverse cuenta con funciones de metadatos avanzados, que permiten una mayor visibilidad y accesibilidad de los datos a otros investigadores y el público en general. Dataverse es utilizado por muchas instituciones académicas y organizaciones gubernamentales para facilitar el acceso y la colaboración en investigaciones a nivel mundial.

¿Cuándo nace Dataverse?

Dataverse fue desarrollado por el Instituto de Política Económica y Social (Institute for Quantitative Social Science – IQSS) de la Universidad de Harvard, en colaboración con otras instituciones académicas y organizaciones, y se lanzó por primera vez en 2010. Desde entonces, ha evolucionado y se ha expandido continuamente, ofreciendo nuevas funciones y herramientas para el almacenamiento, la publicación y el intercambio de datos de investigación.

Hoy en día, Dataverse es utilizado por una amplia gama de instituciones académicas y organizaciones gubernamentales en todo el mundo para facilitar el acceso y la colaboración en investigaciones a nivel mundial. Además, Dataverse sigue siendo una plataforma de código abierto, lo que significa que su desarrollo continúa siendo impulsado por una comunidad global de desarrolladores y usuarios comprometidos con el acceso abierto y la reutilización de datos de investigación.

Dataverse y los principios FAIR

Dataverse está diseñado para cumplir con los principios de datos FAIR, que se refieren a la facilidad con la que los datos de investigación se pueden encontrar, acceder, interoperar y reutilizar. A continuación, se describen algunas maneras en que Dataverse cumple con estos principios:

  • Facilidad para encontrar datos: Dataverse utiliza un esquema de metadatos que permite a los investigadores describir sus datos de manera detallada y precisa, lo que facilita la búsqueda y el descubrimiento de datos relevantes. Además, Dataverse está diseñado para integrarse con motores de búsqueda y catálogos de datos a nivel mundial, lo que aumenta la visibilidad de los datos en la comunidad de investigación.
  • Accesibilidad de los datos: Dataverse proporciona herramientas para gestionar los permisos y los accesos a los datos, lo que permite a los investigadores controlar quién puede acceder a sus datos y bajo qué condiciones. Dataverse también se integra con servicios de autenticación y autorización, lo que facilita el acceso seguro y protegido a los datos.
  • Interoperabilidad de los datos: Dataverse utiliza un esquema de metadatos basado en el estándar internacional DDI, que facilita la interoperabilidad de los datos entre diferentes comunidades de investigación. Dataverse también admite la importación y exportación de datos en diferentes formatos y está diseñado para integrarse con otras herramientas y servicios de gestión de datos de investigación.
  • Reutilización de los datos: Dataverse está diseñado para promover la reutilización de los datos de investigación, proporcionando herramientas para citar y compartir los datos de manera efectiva. Dataverse también permite a los investigadores adjuntar documentos y otros recursos a los datos, lo que facilita su interpretación y análisis por parte de otros investigadores.

¿Cuál es el esquema de metadatos utiliza?

Dataverse utiliza un esquema de metadatos basado en el estándar internacional de intercambio de datos de investigación, el Protocolo de Metadatos para Datos de Investigación (Data Documentation Initiative – DDI). DDI es un conjunto de normas y especificaciones que proporcionan un marco común para describir datos de investigación y su contexto, lo que permite la interoperabilidad y la reutilización de datos entre diferentes comunidades de investigación.

Dataverse también proporciona soporte para otros esquemas de metadatos comunes, como Dublin Core, el Sistema de Clasificación de Disciplinas Académicas (Fields of Science and Technology – FOS) y el Sistema de Clasificación de Disciplinas de la Ciencia Social (Social Science Disciplines – SSWD), lo que permite a los investigadores adaptar la descripción de sus datos a las necesidades de su disciplina y comunidad de investigación específicas.

Dataverse y el uso de DOI

Dataverse se integra con DataCite: DataCite es una organización sin fines de lucro que proporciona servicios para el registro y la asignación de DOIs para datos de investigación. Dataverse se integra con DataCite para permitir a los usuarios asignar DOIs a sus conjuntos de datos y aumentar su visibilidad y citación en la comunidad de investigación. Cada país puedo contar con una institución que administra los DOI del país, lo cual se denomina consorcio local.

Otras agencias que entregan y administran DOI son:

  • EZID: es una agencia de DOI que proporciona servicios para el registro y la asignación de identificadores únicos y persistentes para datos de investigación. 
  • CrossRef: es una organización sin fines de lucro que proporciona servicios para el registro y la asignación de DOIs para publicaciones académicas y otros tipos de contenidos. Aunque CrossRef no está específicamente diseñado para datos de investigación.

Algunas ventajas de usar Dataverse

  1. Facilita la gestión y el almacenamiento de datos: Dataverse proporciona una plataforma fácil de usar para la gestión y el almacenamiento de datos de investigación. Los usuarios pueden cargar y organizar sus datos de manera eficiente, agregar metadatos detallados y colaborar con otros miembros del equipo.
  2. Aumenta la visibilidad y el impacto de los datos: Dataverse permite a los usuarios compartir sus datos con la comunidad de investigación global a través de un repositorio centralizado y fácilmente accesible. Esto aumenta la visibilidad de los datos y, a su vez, puede aumentar su impacto en la comunidad de investigación.
  3. Proporciona herramientas para el análisis y la visualización de datos: Dataverse permite a los usuarios analizar y visualizar sus datos directamente en la plataforma, lo que puede ser especialmente útil para la exploración de datos y la presentación de resultados.
  4. Cumple con los estándares de datos FAIR: Dataverse está diseñado para cumplir con los principios de datos FAIR, lo que significa que los datos almacenados en la plataforma son fácilmente descubribles, accesibles, interoperables y reutilizables.
  5. Promueve la transparencia y la reproducibilidad de la investigación: Al compartir datos en Dataverse, los investigadores pueden fomentar la transparencia y la reproducibilidad de la investigación, lo que aumenta la confianza en los resultados y permite a otros investigadores construir sobre el trabajo anterior de manera más eficaz.

La API de Dataverse

Dataverse cuenta con una API (Interfaz de Programación de Aplicaciones) que permite a los desarrolladores interactuar con la plataforma y acceder a sus funcionalidades desde aplicaciones externas.

La API de Dataverse está diseñada para ser flexible y escalable, lo que significa que se puede utilizar para automatizar tareas, crear flujos de trabajo personalizados y desarrollar aplicaciones que se integren con Dataverse.

La API de Dataverse utiliza un formato de intercambio de datos basado en JSON (JavaScript Object Notation) y está documentada en detalle en la página web oficial de Dataverse. Entre las funcionalidades que se pueden utilizar a través de la API de Dataverse se incluyen:

  • Crear, editar y eliminar conjuntos de datos
  • Subir y descargar archivos
  • Gestionar metadatos de conjuntos de datos
  • Realizar búsquedas de conjuntos de datos
  • Gestionar usuarios y grupos de usuarios
  • Obtener estadísticas de uso

Dataverse cuenta con OAI-PMH

Dataverse cuenta con soporte para el protocolo OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting).

El protocolo OAI-PMH es una especificación técnica que permite la interoperabilidad entre diferentes sistemas de gestión de contenidos digitales, como repositorios de documentos, revistas científicas, bases de datos, etc. A través del protocolo OAI-PMH, un sistema puede exponer sus metadatos a otros sistemas, lo que permite la búsqueda y la recolección automatizada de datos a través de diferentes repositorios.

En el caso de Dataverse, el soporte de OAI-PMH permite a otros sistemas y herramientas de descubrimiento de datos buscar y recolectar metadatos de conjuntos de datos almacenados en Dataverse. Esto aumenta la visibilidad y el impacto de los datos almacenados en Dataverse, lo que a su vez facilita el descubrimiento y el uso de los datos por parte de otros investigadores y miembros de la comunidad científica.

En resumen

Dataverse es una plataforma de gestión y almacenamiento de datos de investigación que cumple con los principios de datos FAIR. Permite a los investigadores cargar, organizar, analizar, visualizar y compartir sus datos de manera eficiente, aumentando su visibilidad e impacto en la comunidad de investigación. Dataverse promueve la transparencia y la reproducibilidad de la investigación y cuenta con una API flexible y escalable que permite a los desarrolladores interactuar con la plataforma y acceder a sus funcionalidades desde aplicaciones externas. Dataverse se integra con varias agencias de DOI, lo que facilita la citación y el seguimiento de los datos de investigación.