Metabolomics Workbench

Metabolomics Workbench
Name	Metabolomics Workbench
Type	Data repository and analysis portal
Established	2011
Owner	National Institutes of Health
Country	United States
Access	Public

Contents

Overview
Data and Resources
Tools and Services
Data Submission and Standards
Scientific Impact and Usage
Governance and Funding

Metabolomics Workbench is a public repository and analysis portal created to support metabolomics research and data sharing. It connects experimental datasets with computational tools and community standards to facilitate reproducible research, linking large-scale experimental efforts and institutional programs across biomedical science. The resource integrates datasets, metadata, and analytical services to serve researchers involved with clinical cohorts, population studies, and translational projects.

Overview

The platform was launched to serve investigators associated with programs such as National Institutes of Health initiatives, coordinated projects like Human Microbiome Project, and consortia including NIH Common Fund efforts, collaborating with institutions such as University of California, San Diego, Broad Institute, and Scripps Research. It provides centralized deposition and retrieval for studies originating at academic centers like Harvard University, Stanford University, and Massachusetts Institute of Technology as well as government laboratories like National Institute of Standards and Technology and Los Alamos National Laboratory. The Workbench aligns with standards promulgated by bodies such as European Bioinformatics Institute, Research Data Alliance, and Global Alliance for Genomics and Health while interfacing with repositories like Gene Expression Omnibus, ProteomeXchange, and ArrayExpress.

Data and Resources

The repository houses experimental data from platforms used by laboratories at Johns Hopkins University, University of Oxford, Max Planck Society, and companies such as Thermo Fisher Scientific and Agilent Technologies. Data types include mass spectrometry outputs from vendors like Waters Corporation and Sciex, nuclear magnetic resonance spectra comparable to archives maintained by Biological Magnetic Resonance Data Bank, and curated metabolite annotations informed by chemical resources such as PubChem, ChEBI, and ChemSpider. The Workbench catalogs study metadata linked to cohorts studied at centers like Mayo Clinic, Cleveland Clinic, and Imperial College London, and integrates clinical phenotype descriptors used in projects by European Molecular Biology Laboratory and Wellcome Trust. It cross-references compound identifiers from resources maintained by National Center for Biotechnology Information and ontology terms promoted by National Library of Medicine.

Tools and Services

Users access analytic pipelines inspired by software developed at University of California, Berkeley, Princeton University, and University of Cambridge, along with implementations of algorithms from teams at Carnegie Mellon University and Columbia University. The platform offers visualization modules akin to tools produced by Broad Institute and interoperable interfaces that mirror services from European Bioinformatics Institute and EMBL-EBI MetaboLights. It supports integration with workflow engines used at Lawrence Berkeley National Laboratory and statistical toolkits from groups at University of Washington and Pennsylvania State University. Training materials and tutorials are comparable to courses offered by Cold Spring Harbor Laboratory and workshops run by Gordon Research Conferences and American Society for Mass Spectrometry.

Data Submission and Standards

Submission pipelines align with community standards advocated by organizations such as Metabolomics Society, International Society for Computational Biology, and standardization efforts at International Union of Pure and Applied Chemistry. Metadata schemas reflect practices promoted by DataCite, Open Biological and Biomedical Ontology Foundry, and terminologies used by SNOMED International. The platform implements quality-control checks following recommendations from task forces associated with NIH Office of Data Science Strategy and supports persistent identifiers compatible with systems like Digital Object Identifier and registries such as ORCID. It coordinates with projects at National Cancer Institute and policy frameworks discussed at World Health Organization meetings to ensure ethical and reproducible sharing.

Scientific Impact and Usage

Researchers from institutes including Stanford University School of Medicine, Yale University, University of Pennsylvania, and University of Toronto have deposited studies that contributed to discoveries cited in journals like Nature, Science, Cell, and PNAS. The resource has enabled cross-study meta-analyses performed by teams at Harvard Medical School, University of California, San Francisco, and Mayo Clinic and has informed translational research programs at Genentech, Roche, and Novartis. It has supported collaborations with population-scale efforts such as UK Biobank and disease-focused consortia including Alzheimer's Disease Neuroimaging Initiative and Cancer Genome Atlas-related metabolomics projects.

Governance and Funding

Governance involves oversight and partnerships among federal research entities like National Institutes of Health, advisory groups comprising representatives from Metabolomics Society, and institutional partners from universities such as Duke University and Ohio State University. Funding sources include awards from National Institute of General Medical Sciences, grants administered through NIH Common Fund, and cooperative agreements with research infrastructures supported by National Science Foundation programs and philanthropic organizations like Howard Hughes Medical Institute and the Gates Foundation. Operational decisions and community outreach are coordinated with stakeholders from academic consortia, corporate partners, and standards bodies including Research Data Alliance and Global Alliance for Genomics and Health.

Category:Bioinformatics databases Category:Metabolomics