Trouver des données

Des entrepôts de données dans vos disciplines

Pour identifier des entrepôts spécialisés, plusieurs options sont envisageables.

  • Nous avons pré-sélectionné une liste d’entrepôts disciplinaires en physique et en chimie qui présentent la particularité de permettre la recherche comme le dépôt de données.
  • Il existe également un nombre non-négligeable d’entrepôts ne permettant que la consultation de données, si vous n’êtes pas affiliés à l’institution ou au projet. Utilisez le tableau ci-dessous pour les explorer.

Si vous voulez élargir votre recherche, le répertoire Re3data.org (Registry of Research Data Repositories), crée en 2012 et financé par la German Research Foundation DFG référence, en avril 2020, 2487 entrepôts, tous domaines confondus. Parmi eux, 204 sont classés parmi les entrepôts de chimie et 289 en physique.
Si ces chiffres peuvent paraître colossaux, dans la réalité, le choix à disposition n’est pas toujours aussi large qu’il n’y paraît… Certains entrepôts occupent des secteurs de niche (cas d’un entrepôt spécialisé dans les données de conservation du poisson-zèbre sous forme de sperme congelé, pourtant rangé dans les entrepôts de chimie), d’autres nécessitent une affiliation institutionnelle pour pouvoir consulter les données (cas de l’entrepôt de l’Imperial College de Londres).

L’outil Re3Data permet de chercher des entrepôts par mot-clé, par sujet, par pays etc. Pour chaque plateforme, des icônes dressent une sorte de carte d’identité de l’entrepôt.

L’icône bleue vous signale que l’entrepôt fournit des identifiants pérennes (DOI), l’icône rouge indique que l’entrepôt répond à des critères qualité (certification).

D’autres répertoires internationaux existent, tels que Repository Finder, OpenDoar (filtre datasets) et Fairsharing.org.

Entrepôts généralistes

ADS (Astrophysics Data System)

Institution porteuse : Observatoire Astrophysique Smithsonien (SAO)
ADS propose 3 bases de données contenant plus de 13 millions de publications dans les domaines de l'astronomie, l'astrophysique et la physique.

BindingDB

Institution porteuse : Université de Californie à San Diego

CERN Open Data Portal

Institution porteuse : CERN (Suisse)
Point d'accès unique aux données produites par les recherches menées au CERN (programmes ALICE, ATLAS, etc.)

DataONE

Institution porteuse : Collaboration entre plusieurs partenaires, financée par la Fondation Nationale étatsunienne pour la Science (NSF)
Accès à plus de 800 000 jeux de données. L'entrepôt dispose de nombreuses fonctionnalités de recherche.

ECCAD

Institution porteuse : Aeris
Données atmosphériques disponibles au format NetCDF CF.

European Data Portal

Institution porteuse : Bureau des Publications de l'Union Européenne (Publications Office of the European Union)
Accès à près de 1 200 000 jeux de données dans 81 catalogues nationaux. Les données proviennent de toutes les disciplines, et sont organisées par catégories, dont 'Energie', 'Environnement', 'Santé', 'Science et Technologie' et 'Transports' entre autres.

Johns Hopkins Turbulence Databases

Institution porteuse : Université John Hopkins
Base de données sur les turbulences de plusieurs téraoctets. Il est possible de l'interroger via un navigateur web ou des webservices (C, matlab, python). Un onglet présente les publications liées.

Mass Bank

Institution porteuse : Mass Bank consortium
Données de spectrométrie de masse. Recherche possible par formule chimique, InChIKey, pics etc.

Materials Data Facility (MDF)

Institution porteuse : Université de Chicago
Donne accès à plus de 500 jeux de données en science des matériaux. Soutenu par le National Institute of Standards and Technology (NIST).

Materials Platform for Data Science (MPDS)

Institution porteuse : Université de Genève ; Scientific Consulting Company "Structure-Properties" (Lviv, Ukraine)aine.
Base de données comprenant 2 millions d'entrées dans 3 thématiques : propriété physique, structures cristallographiques, diagrammes de phase.
A noter : accès gratuit à la recherche mais plusieurs produits sont payants.

MatrixDB

Institution porteuse : Université Lyon 1
Donne accès à des données expérimentales d'interaction de protéines de matrices extracellulaires, de protéoglycanes et de polysaccharides.

National Centers for Environmental Information (NCEI)

Institution porteuse : Agence américaine d'observation océanique et atmosphérique NOAA (National Oceanic and Atmospheric Administration)
Accès à une des plus larges archives de données relatives à la recherche océanique, atmosphérique et recherche en géophysique du monde.

Science Data Portal

Institution porteuse : Institut National étatsunien des Standards et de la Technologie (NIST)
Donne accès à des jeux de données issus de plusieurs bases en sciences des matériaux, chimie, données nucléaires.

Service International des Services Géomagnétiques (ISGI)

Institution porteuse : Université de Strasbourg
Entrepôt d'indices géomagnétiques.

SureChemBL

Institution porteuse : European Bioinformatics Institute
Permet de rechercher des entités chimiques parmi les publications de brevets. L'outil de recherche est conçu pour la chimie en incluant l'éditeur de molécules Marvin JS.