Linked Open Data in Libraries Archives and Museums

Linked Open Data in Libraries Archives and Museums
Title	Linked Open Data in Libraries Archives and Museums

Contents

Introduction

Early adopters in the sector included projects at National Diet Library (Japan), Library and Archives Canada, National Library of Finland, State Library of New South Wales, and National Library of Sweden, which experimented with Resource Description Framework triples, URIs, and controlled vocabularies such as Library of Congress Subject Headings and Getty Art & Architecture Thesaurus. Major cultural aggregators including Europeana, Digital Public Library of America, Trove (National Library of Australia), Gallica, and DPLA have promoted interoperable metadata and open licensing policies informed by Creative Commons and national open data mandates from Canadian Heritage and United Kingdom Data Service. Collaborations often involve museums like Metropolitan Museum of Art, archives like National Archives and Records Administration, and research institutions such as Max Planck Society.

Technical stacks commonly include Apache Jena, Blazegraph, Virtuoso (triple store), and tools from OpenRefine and Knoesis Center for reconciliation. Content delivery often uses APIs influenced by OpenAPI Initiative and deployment on platforms like GitHub and GitLab with continuous integration practices from Jenkins (software). Institutions integrate linked data with collection management systems such as TMS (The Museum System), Axiell, and discovery services like Blacklight (software) and VuFind, while leveraging cloud providers like Amazon Web Services, Google Cloud Platform, and Microsoft Azure for scalability.

Prominent models include CIDOC Conceptual Reference Model for cultural heritage, Dublin Core Metadata Initiative for descriptive metadata, and authority control via Virtual International Authority File and Library of Congress Name Authority File. Semantic mappings use vocabularies like SKOS, FOAF, PROV-O, and domain ontologies from Getty Vocabularies and Europeana Data Model. Preservation and interoperability engage frameworks such as Open Archival Information System and legal regimes like European Union General Data Protection Regulation, impacting how personal data in archival records is represented.

Workflows marry archival appraisal at National Archives (United States), digitization strategies used by Biblioteca Nacional de España, and cataloging workflows grounded in Library of Congress Classification and Universal Decimal Classification. Projects coordinate stakeholders including curators from Tate Galleries, registrars from Smithsonian American Art Museum, and digital librarians at Columbia University. Best practices emphasize persistent identifiers from Handle System and policy frameworks modeled on FAIR data principles and open licensing via Creative Commons to enable reuse by aggregators such as Europeana Foundation and research infrastructures like CLARIN.

Challenges include reconciling conflicting authority data across files such as Virtual International Authority File and national registries, addressing colonial-era provenance issues in collections like British Museum and Musée du Louvre, and protecting culturally sensitive materials from indigenous communities such as those represented by First Nations and National Museum of the American Indian. Legal constraints from European Union directives and technical debts in legacy systems like MARC 21 complicate migration. Ethical considerations require consultation with stakeholders including United Nations Permanent Forum on Indigenous Issues and adherence to norms from International Council of Museums.

Notable projects include Europeana, Digital Public Library of America, Linked Art, Smithsonian Open Access, British Library Labs, Getty Research Institute Linked Data Service, Trove, and the National Library of Norway’s BIBSYS initiatives. Academic collaborations feature Stanford University Libraries, OCLC Research, Princeton University, and Harvard Library which have demonstrated entity reconciliation, enriched discovery interfaces, and research data linking with repositories like Zenodo and Figshare.

Trends point to tighter integration with research infrastructures such as ORCID, Crossref, DataCite, and national digital strategies from bodies like European Commission and United States Digital Service. Emerging practices emphasize linked open vocabularies from Getty Vocabulary Program, machine reasoning via Wikidata, and cross-domain reuse with projects involving Internet Archive and Wikimedia Foundation. Adoption will likely accelerate through consortia such as DuraSpace and standards development with World Wide Web Consortium and International Organization for Standardization.

Category:Library science Category:Museum studies Category:Archives