Trouver des données

Des entrepôts de données dans vos disciplines

Pour identifier des entrepôts spécialisés, plusieurs options sont envisageables.

  • Nous avons pré-sélectionné une liste d’entrepôts disciplinaires en physique et en chimie qui présentent la particularité de permettre la recherche comme le dépôt de données.
  • Il existe également un nombre non-négligeable d’entrepôts ne permettant que la consultation de données, si vous n’êtes pas affiliés à l’institution ou au projet. Utilisez le tableau ci-dessous pour les explorer.

Si vous voulez élargir votre recherche, le répertoire Re3data.org (Registry of Research Data Repositories), crée en 2012 et financé par la German Research Foundation DFG référence, en avril 2020, 2487 entrepôts, tous domaines confondus. Parmi eux, 204 sont classés parmi les entrepôts de chimie et 289 en physique.
Si ces chiffres peuvent paraître colossaux, dans la réalité, le choix à disposition n’est pas toujours aussi large qu’il n’y paraît… Certains entrepôts occupent des secteurs de niche (cas d’un entrepôt spécialisé dans les données de conservation du poisson-zèbre sous forme de sperme congelé, pourtant rangé dans les entrepôts de chimie), d’autres nécessitent une affiliation institutionnelle pour pouvoir consulter les données (cas de l’entrepôt de l’Imperial College de Londres).

L’outil Re3Data permet de chercher des entrepôts par mot-clé, par sujet, par pays etc. Pour chaque plateforme, des icônes dressent une sorte de carte d’identité de l’entrepôt.

L’icône bleue vous signale que l’entrepôt fournit des identifiants pérennes (DOI), l’icône rouge indique que l’entrepôt répond à des critères qualité (certification).

D’autres répertoires internationaux existent, tels que Repository Finder, OpenDoar (filtre datasets) et Fairsharing.org.

4TU.ResearchData

Institution porteuse : 4TU.Federation, Université Technique de Delft (TU Delft), Université technique d'Eindhoven (TUE), Université de Twente, Université de Wageningen (WUR)
Base de données internationales pour la science, l'ingénierie et la conception. Propose plus de 10 000 jeux de données.

ADS (Astrophysics Data System)

Institution porteuse : Observatoire Astrophysique Smithsonien (SAO)
ADS propose 3 bases de données contenant plus de 13 millions de publications dans les domaines de l'astronomie, l'astrophysique et la physique.

Aviso+

Institution porteuse : Centre National d'Etudes Spatiales (CNES)
Aviso+ distribue des données altimétriques océaniques recueillies par satellites. Propose différents produits comme les hauteurs de mer ou les données vent/vagues, différents indicateurs, et autres...

Bass2000

Institution porteuse : Observatoire de Paris
Base de données d'observation du Soleil par des instruments au sol.

BindingDB

Institution porteuse : Université de Californie à San Diego

Cambridge Structural Database (CSD)

Institution porteuse : Cambridge Crystallographic Data Centre (CCDC)
Accès à plus d'un million de structures cristallines organiques et organométalliques à petites molécules. Données au format CIF.

Catalysis-Hub

Institution porteuse : Center for Interface Science and Catalysis, SLAC National Accelerator Laboratory, Stanford University
Une plateforme Web pour partager des données et des logiciels pour la recherche en catalyse computationnelle.

Centre de Données de la Physique des Plasmas (CDPP)

Institution porteuse : Centre National d'Etudes Spatiales, Université Toulouse III - Paul Sabatier, Observatoire de Paris, CNRS
CDPP distribue des données de physique des plasmas. Les données proviennent de différentes missions spatiales telles que Arcad-3, Cassini, Cluster, Demeter, Double Star, etc...

CERN Open Data Portal

Institution porteuse : CERN (Suisse)
Point d'accès unique aux données produites par les recherches menées au CERN (programmes ALICE, ATLAS, etc.)

DataONE

Institution porteuse : Collaboration entre plusieurs partenaires, financée par la Fondation Nationale étatsunienne pour la Science (NSF)
Accès à plus de 800 000 jeux de données. L'entrepôt dispose de nombreuses fonctionnalités de recherche.

ECCAD

Institution porteuse : Aeris
Données atmosphériques disponibles au format NetCDF CF.

Electronic Archiving SYstem (EASY)

Institution porteuse : CLARIAH (Common Lab Research Infrastructure for the Arts and Humanities), DANS (Data Archiving and Networked Services), KNAW (Royal Netherlands Academy of Arts and Sciences), NWO (Netherlands Organisation for Scientific Research)
EASY est un entrepôt multidisciplinaire proposant près de 160 000 jeux de données, dont plus de 28 000 dans les sciences interdisciplinaires, 29 000 dans les sciences de la vie, la santé et la médecine, et 600 dans les sciences et technologies.

European Data Portal

Institution porteuse : Bureau des Publications de l'Union Européenne (Publications Office of the European Union)
Accès à près de 1 200 000 jeux de données dans 81 catalogues nationaux. Les données proviennent de toutes les disciplines, et sont organisées par catégories, dont 'Energie', 'Environnement', 'Santé', 'Science et Technologie' et 'Transports' entre autres.

European Union Observatory for Nanomaterials (EUON)

Institution porteuse : Agence européenne des produits chimiques (ECHA)
EUON fournit des données sur les nanomatériaux disponibles sur les marchés européens. La recherche s'effectue par nanomatériau. La base de données contient 333 entrées/substances.

Figshare

Institution porteuse : Digital Science (groupe éditorial Holtzbrinck)
Figshare est un entrepôt multidisciplinaire proposant plus de 1 500 000 jeux de données.

GEISA

Institution porteuse : Ecole Polytechnique
Geisa propose des données spectroscopiques pour faciliter les calculs de transferts radiatifs atmosphériques.

Harvard Dataverse

Institution porteuse : Université de Harvard, IQSS (Institute for Quantitative Social Science)
Accès à plus de 100 000 jeux de données.

IMEx Consortium

Institution porteuse : EMBL-EBI (Institut européen de bioinformatique, fait partie du laboratoire européen de biologie moléculaire EMBL)
Données d’interactions moléculaires, mises à disposition dans des standards conformes aux normes (PSI-MI XML2.5 ou MITAB).

Johns Hopkins Turbulence Databases

Institution porteuse : Université John Hopkins
Base de données sur les turbulences de plusieurs téraoctets. Il est possible de l'interroger via un navigateur web ou des webservices (C, matlab, python). Un onglet présente les publications liées.

Mass Bank

Institution porteuse : Mass Bank consortium
Données de spectrométrie de masse. Recherche possible par formule chimique, InChIKey, pics etc.

Materials Data Facility (MDF)

Institution porteuse : Université de Chicago
Donne accès à plus de 500 jeux de données en science des matériaux. Soutenu par le National Institute of Standards and Technology (NIST).

Materials Platform for Data Science (MPDS)

Institution porteuse : Université de Genève ; Scientific Consulting Company "Structure-Properties" (Lviv, Ukraine)
Base de données comprenant 2 millions d'entrées dans 3 thématiques : propriété physique, structures cristallographiques, diagrammes de phase.
A noter : accès gratuit à la recherche mais plusieurs produits sont payants.

MatrixDB

Institution porteuse : Université Lyon 1
Donne accès à des données expérimentales d'interaction de protéines de matrices extracellulaires, de protéoglycanes et de polysaccharides.

Mendeley Data

Institution porteuse : Elsevier
Accès à 27 millions de jeux de données multidisciplinaires, liés à des publications ou provenant d'autres entrepôts de données.

National Centers for Environmental Information (NCEI)

Institution porteuse : Agence américaine d'observation océanique et atmosphérique NOAA (National Oceanic and Atmospheric Administration)
Accès à une des plus larges archives de données relatives à la recherche océanique, atmosphérique et recherche en géophysique du monde.

NIST MML Materials Data Repository

Institution porteuse : Institut National des Standards et de la Technologie (NIST) (Etats-Unis)
Cette base de données fait partie de l'Initiative Génome de Matériaux (Materials Genome Initiative MGI) visant à établir des protocoles et des mécanismes d'échange de données pour améliorer leur qualité et améliorer les modèles sur les matériaux.

Nuclear Data Service

Institution porteuse : International Atomic Energy Agency (IAEA)
Donne accès à de nombreuses bases de données (propriétés atomiques et nucléaires, codes, rapports). Plus de 11 millions de données atomiques, moléculaires et nucléaires sont mises à disposition.

Open Science Framework (OSF)

Institution porteuse : Centre pour la Science Ouverte (COS)
Entrepôt de données multidisciplinaire proposant près de 200 000 jeux de données. Plateforme de travail collaboratif et de partage de données, permet la visualisation des données et le lien avec d'autres plateformes de stockage.

Science Data Portal

Institution porteuse : Institut National étatsunien des Standards et de la Technologie (NIST)
Donne accès à des jeux de données issus de plusieurs bases en sciences des matériaux, chimie, données nucléaires.

Service International des Services Géomagnétiques (ISGI)

Institution porteuse : Université de Strasbourg
Entrepôt d'indices géomagnétiques.

SPECTR-W3

Institution porteuse : Russian Scientific Research Institute of Technical Physics
Base de données portant sur les propriétés spectroscopiques des atomes et des ions.

SpectraBase

Institution porteuse : Wiley
Base de données de spectres de masse, RMN, IR, Raman et UV-Visible. Recherche possible par nom, InChIKey, numéro CAS, ou en dessinant une structure chimique. Les données ne sont pas modérées.

SureChemBL

Institution porteuse : European Bioinformatics Institute
Permet de rechercher des entités chimiques parmi les publications de brevets. L'outil de recherche est conçu pour la chimie en incluant l'éditeur de molécules Marvin JS.

WURM

Institution porteuse : ENS Lyon
Base de données de spectroscopie Raman pour les minéraux. Fournit des informations additionnelles sur les structures des cristaux, les spectres infrarouges et d'autres propriétés physiques des minéraux.

wwPDB

Institution porteuse : Worldwide Protein Data Bank Foundation
Base de données de structures 3D de protéines, acides nucléiques et assemblages complexes.

Zenodo

Institution porteuse : CERN
Accès à plus de 1 600 000 objets de recherche, dont près de 70 000 jeux de données, 40 000 logiciels de recherche, etc. Les données ne sont pas modérées.