InvenioRDM — LLMpedia

InvenioRDM
Name	InvenioRDM
Developer	CERN, TIND, Dataverse, Zenodo
Released	2020
Programming language	Python, JavaScript
Operating system	Unix-like
License	MIT

Contents

Overview
History and Development
Architecture and Features
Deployment and Integration
Use Cases and Adoption
Governance and Community
Security and Compliance

InvenioRDM InvenioRDM is a digital repository platform derived from a research data management ecosystem, designed for scholarly CERN, TIND, Zenodo, Dataverse, European Organization for Nuclear Research, Harvard University. It supports archiving, discovery, and sharing of scholarly outputs for institutions such as MIT, Stanford University, University of Cambridge, University of Oxford. The platform integrates with services used by OpenAIRE, Crossref, DataCite, ORCID, CLOCKSS.

Overview

InvenioRDM provides metadata-driven services influenced by standards adopted by DataCite, Dublin Core, Schema.org, JSON-LD, OAI-PMH, SWORD, offering persistent identifier management compatible with DOI and Handle System. The software is built on a stack used by projects at CERN and leverages libraries and practices from communities around Flask, React, ElasticSearch, PostgreSQL. Institutions including University of California, Max Planck Society, Princeton University, Columbia University use it alongside systems like Fedora Commons, DSpace, EPrints.

History and Development

Development traces to initiatives at CERN that intersect with collaborations among TIND, Zenodo, DataCite, OpenAIRE and research libraries such as The British Library, Library of Congress, Bibliothèque nationale de France. Early influences include repository platforms like Invenio (software), DSpace, EPrints, and projects funded by European Commission frameworks and grants involving Horizon 2020 and Horizon Europe. Contributors include engineers and librarians from Harvard University, Stanford University, MIT, Princeton University, and firms such as GitHub, Red Hat, Canonical. The project adopted modern web stacks inspired by work at Mozilla and Google and follows agile practices shaped by teams at NASA and ESA.

Architecture and Features

The architecture combines microservices and monolithic components influenced by designs at Spotify, Netflix, Twitter and uses components from Elasticsearch, Redis, PostgreSQL, Celery, Docker, Kubernetes. Core features support rich metadata schemas aligned with DataCite, integration with identifier registries like Crossref and ORCID, and storage backends similar to services used by GitLab, Amazon S3, CERN EOS. The user interface is implemented with patterns common to React, AngularJS, and accessibility practices recommended by W3C and WCAG. Authentication and authorization integrate with identity providers such as Shibboleth, LDAP, OAuth2, SAML, and support for federated login used by eduGAIN and InCommon.

Deployment and Integration

Deployment options include containerized orchestration using Kubernetes, virtualized environments from VMware, and cloud platforms operated by Amazon Web Services, Google Cloud Platform, Microsoft Azure, and academic clouds like OpenStack instances at European Grid Infrastructure. Integrations exist with scholarly infrastructures like Crossref, DataCite, ORCID, OpenAIRE, and institutional systems including Symplectic Elements, Pure (Elsevier), CRIS platforms at University of Edinburgh, University of Toronto. Continuous integration and delivery practices mirror toolchains at Jenkins, GitLab CI, Travis CI, and container registries used by Docker Hub.

Use Cases and Adoption

Use cases span institutional repositories at University of Oxford, subject repositories like Zenodo, data publication services at Max Planck Society, research data management at European Molecular Biology Laboratory, and archival workflows for national libraries such as Library of Congress and Bibliothèque nationale de France. It supports scholarly communication workflows used by publishers like Elsevier, Springer Nature, Wiley, and repositories partnering with funders such as Wellcome Trust, Bill & Melinda Gates Foundation, National Institutes of Health. Academic departments at MIT, Yale University, Columbia University have adopted it for theses, datasets, and software archiving analogous to services at Figshare and Dryad.

Governance and Community

Governance involves stewarding organizations including CERN and community contributors from libraries and vendors such as TIND, Zenodo, DataCite, and university research offices at Harvard University and ETH Zurich. Community engagement mirrors ecosystems around Apache Software Foundation, Linux Foundation, and standards bodies like Research Data Alliance, CODATA, National Information Standards Organization with events similar to International Digital Curation Conference and collaborations at RepCon and Open Repositories. Development contributions come through workflows on GitHub and coordination via mailing lists and working groups resembling those at W3C.

Security and Compliance

Security practices align with frameworks used by ISO/IEC 27001, NIST, GDPR compliance guidance from European Commission, and preservation standards advocated by LOCKSS and CLOCKSS. Deployment scenarios consider accreditation regimes similar to those required by JISC and national research infrastructures, and integrate with archival systems following guidance from Digital Preservation Coalition and International Council on Archives. Authentication and audit trails follow patterns used by SAML, OAuth2, and logging approaches used at ELK Stack deployments.

Category:Repository software