Proyecto Dataverse
Sumario
El proyecto Dataverse es una aplicación web de código abierto para compartir, preservar, citar, explorar y analizar datos de investigación, que facilita la publicación de los datos a otros y permite replicar el trabajo de otros con mayor facilidad.
La idea que subyace tras el proyecto Dataverse es la de automatizar gran parte del trabajo del archivero profesional, y proporcionar servicios para el creador de los datos y distribuir su crédito.
Organizaciones promotoras
Dataverse es una iniciativa impulsada por el Institute for Quantitative Social Science (IQSS) de la Universidad de Harvard, que lidera el desarrollo de la aplicación desde 2006. El Harvard Dataverse cuenta con el apoyo de la Harvard Library y de Harvard University Information Technology (HUIT), que garantizan su sostenibilidad técnica e institucional.
A nivel internacional, el proyecto se ha expandido a través de una red de repositorios nacionales e institucionales que utilizan el software Dataverse, como DataverseNL (Países Bajos), DataverseNO (Noruega), HeiDATA (Alemania), CIRAD Dataverse (Francia) o Borealis en Canadá, coordinado por el Ontario Council of University Libraries. Estas implementaciones han dado lugar a una comunidad global y federada que comparte buenas prácticas y colabora en la evolución de la plataforma.
Objetivos
Antes de que existiera el proyecto Dataverse, los investigadores se veían obligados a elegir entre recibir crédito por sus datos, gestionando ellos mismos la distribución, pero sin tener garantías de preservación a largo plazo, enviándolos a un archivo profesional, y sin recibir demasiado crédito.
El Proyecto elimina esta elección con el establecimiento de un repositorio Dataverse, que aloja múltiples archivos virtuales llamados colecciones Dataverse. La instalación de una colección Dataverse en el sitio web de una institución mantiene el aspecto, la marca y la URL del sitio web, pero se incluye una cita académica para los datos que le da a la institución el crédito total y visibilidad en la web. La página del sitio web de la institución es servida por un repositorio Dataverse, con respaldo institucional y garantías de preservación a largo plazo.
En este momento, los objetivos estratégicos del Proyecto son:
- Aumentar la adopción (tanto de usuarios, como de repositorios Dataverse, colecciones Dataverse, conjuntos de datos y revistas).
- Desarrollar la capacidad de manejar datos sensibles de nivel 3, a gran escala y en flujo.
- Ampliar las funciones de datos y metadatos para las disciplinas existentes y nuevas.
- Ampliar las funciones de archivo y preservación.
- Aumentar las contribuciones de la comunidad de desarrollo de código abierto.
- Mejorar la experiencia de usuario y la interfaz del usuario.
- Seguir aumentando la calidad del software.
Beneficiarios y stakeholders
Los principales beneficiarios del proyecto Dataverse son los investigadores, las revistas, los autores de los datos, los editores, los distribuidores de datos y las instituciones afiliadas, ya que consiguen recibir reconocimiento académico y visibilidad en la web, al tiempo que también se les permite preservar a largo plazo los datos de la investigación.
Resultados
El proyecto Dataverse estandariza la citación de los conjuntos de datos y facilita a los investigadores la publicación de sus datos y el reconocimiento de su trabajo, por lo que al aumentar la visibilidad de los datos de investigación los investigadores obtienen el reconocimiento y el crédito académico adecuado para su trabajo.
A su vez, al depositar los datos de la investigación en un repositorio Dataverse, los investigadores cumplen los requisitos de las agencias de financiación en cuanto a planes de gestión de datos.
Por otro lado, el proyecto ayuda a los investigadores a cumplir con el requisito -por parte de muchas revistas, editoriales y organismos de financiación- de depositar los conjuntos de datos de réplica en un repositorio público.
El proyecto apoya a los investigadores con el depósito de conjuntos de datos de replicación, haciendo que este tipo de datos sea fácilmente descubrible para que otros investigadores puedan reutilizar y verificar que un estudio puede ser replicado sin tener que ponerse en contacto con los autores del estudio.
Retos
La implementación de Dataverse exige superar una elevada complejidad técnica y una curva de aprendizaje considerable, lo que requiere formación especializada. Además, implica costes de infraestructura y la dedicación de personal TI para garantizar su mantenimiento y sostenibilidad.
Evidencia de éxito
El proyecto Dataverse ha crecido considerablemente con el tiempo y ahora es un importante proyecto de colaboración internacional. Asimismo, el software Dataverse se ha traducido a varios idiomas.
A lo largo del periodo 2017-2022, ha aumentado en más de 10 mil la cantidad de Dataverses, mientras que, durante el mismo periodo, el número total de datasets se ha visto incrementado en casi 200 mil.
Por lo que respecta al volumen total de ficheros del proyecto, durante el periodo 2016-2022, ha pasado de haber 184 miles de ficheros a más de 2 millones en el último mes de junio de 2022. De la misma forma, el número de descargas de ficheros a lo largo de este periodo también ha aumentado exponencialmente, pasando de 1,86 millones de descargas a un total de 68,1 millones el pasado junio.
Bibliografía
- An Introduction to the Dataverse Network as an Infrastructure for Data Sharing: https://gking.harvard.edu/files/abs/dvn-abs.shtml
- Metrics: https://dataverse.org/metrics
- Roadmap: The Dataverse Project: https://www.iq.harvard.edu/roadmap-dataverse-project
Información específica
Temática: Políticas de acceso abierto, Datos de investigación, Preservación digital
Escala de implementación: Internacional
Agentes responsables: Universidades (órganos de gobierno), Personal investigador
Localización: Estados Unidos
Palabras clave: repositorios, software de código abierto, preservación
Fecha de inicio y final: 2006 -
Sostenibilidad: Sí
Documento PDF:
Descargar archivo
Buscar por
Información de autoría
Fecha de creación: 03/08/2022
Autor/a del registro: Berta Ollé Pérez
Institución autor/a: Universitat de Barcelona