FAIRisation des données
- Les principes FAIR et l’écosystème de la recherche : les exigences
- La mise en œuvre des principes FAIR
- Ressources pour la FAIRisation de données
Les principes FAIR (Findable, Accessible, Interoperable and Reusable) sont un ensemble de bonnes pratiques, qui, partagées, favorisent la transparence, la réutilisabilité et la reproductibilité des résultats de recherche, dans une perspective de science ouverte.
Une infographie interactive réalisée par DoraNum reprend chaque principe et l’illustre dans le contexte des données de recherche.
Ces principes s’appliquent donc aux données, mais aussi à l’ensemble des produits de recherche, aux instruments et aux infrastructures. Porteurs d’enjeux scientifiques majeurs (reproductibilité, réutilisation), ils sont repris par de nombreux acteurs de l’écosystème de la recherche (acteurs politiques, agences de financement, éditeurs) et déclinés dans différents domaines de la chimie et de la physique.
De nombreux outils et initiatives ont été élaborés pour favoriser la FAIRification des données : voici une sélection !
Quels enjeux ?
Des enjeux scientifiques
Les principes FAIR favorisent la transparence, la reproductibilité et la réutilisabilité des données mais aussi des codes, des workflows (et hardware) et permettent de dépasser les barrières à la découverte et au traitement automatique des données par des machines, dans un contexte de croissance des volumes et de complexité des données traitées. Ils permettent la mise en œuvre concrète de la science ouverte.
Plus largement, les appliquer dans le cadre de son travail de recherche permet sans doute plus d’efficacité.
Des enjeux économiques
Une étude réalisée en 2018 par la Commission Européenne « Cost-Benefit analysis for FAIR research data – Cost of not having FAIR research data”, identifie les coûts associés à la non FAIRisation des données tant en termes de perte de temps, de coût de stockage de données redondantes, etc. L’ensemble de ces coûts s’élèverait à 3% du budget de la recherche en Europe (mais 78% du budget du programme H2020) soit 10,2 Mds d’€ par an (en 2016).
La mise en œuvre des principes FAIR au niveau institutionnel et au niveau des communautés scientifique est variable :
- D’après les données 2022 de l’Observatoire EOSC, 34% des pays européens disposeraient d’une politique nationale sur les données FAIR.
- En 2024, l’éditeur IOP a réalisé une étude sur le partage des données à partir d’un corpus de plus de 30000 articles dans le domaine de la physique ; seul un chercheur sur 10 partage des données FAIR. La répartition par thématique montre que, sauf dans les sciences de l’environnement, le partage de données FAIR est peu répandu.
Pour aller plus loin sur les enjeux des principes FAIR: voir l’intervention réalisée dans le cadre du NFDI Physical Science Joint Colloquium “Fair Data: no longer optional, but it takes a village !” par le Dr Sansone, associate director du Centre de e-Research d’Oxford.
Les principes FAIR et l’écosystème de la recherche : les exigences
Les financeurs
Certaines agences de financement placent les principes FAIR au centre des dispositifs de soutien à la science ouverte. L’ANR décrit dans sa FAQ les Plans de gestion de Données comme «…un outil d’aide pour mettre en place une réflexion autour des données de la recherche afin de les rendre FAIR (Faciles à trouver, Accessibles, Interopérables, Réutilisables). ».
En cohérence avec le rapport Turning FAIR into reality (2018), Horizon Europe recommande que les données soient partagées de manière aussi ouverte que possible, aussi fermées que nécessaires et exige pour les projets financés un Plan de gestion des données pour des données FAIR.
Les éditeurs et sociétés savantes
Certains éditeurs peuvent soutenir formellement les principes FAIR et encourager les auteurs à les suivre, reconnaissant la part que tiennent les données dans le processus de recherche (voir sur ce point un billet de blog).
C’est le cas de la plupart des éditeurs généralistes (Wiley, Taylor et Francis )
Du côté des éditeurs en chimie, l’ACS recommande la mise en œuvre des principes FAIR pour des raisons éthiques.
Du côté des éditeurs en physique, IOP encourage les auteurs à partager leurs données de recherche en utilisant des formats ouverts et des normes reconnues par leur communauté
Les Physical Review journals ont la même politique.
Les éditeurs du Journal of Cheminformatics ont été interpellés sur la nécessité d’imposer l’utilisation de structures chimiques FAIR :Dans leur réponse, les éditeurs soulignent l’importance des principes FAIR mais également les difficultés pratiques associées au fait de les rendre obligatoires. Toutefois, certains types de publications de cette revue, les Data Notes, sont centrés sur la FAIRisation des données. Ils comportent une section “description des données” et deux sous sections “Curation and FAIR-ification”. Voici un exemple de publication.
L’American Geophysical Union souligne dans sa Position Statement on Data l’enjeu du libre accès aux données des sciences de la terre sous de multiples formats et de la préservation à long terme des données. Les revues de l’AGU suivent les principes des FAIR data.
La mise en œuvre des principes FAIR
Tels que décrits en 2016, les principes FAIR s’appliquent aux données mais aussi à d’autres produits de recherche, (codes, matériel et infrastructures). Lire par exemple Cousijn, H. (2022). FAIR is everywhere.
Nous retenons ici quelques domaines d’application des principes FAIR en physique et chimie.
Données
Focus Chimie
“Chemistry data should be FAIR, proponents say. But getting there will be a long road” comme le souligne un éditoral de Chemical and Engineering News de l’ACS. Nous vous revenons sur quelques uns des réseaux, travaux et initiatives lancés pour accompagner la FAIRisation des données en chimie.
Le Go FAIR Chemistry Implementation Network (ChIN) est un consortium rassemblant la communauté des chimistes afin de promouvoir des standards, des logiciels et des pratiques qui aillent dans le sens des principes FAIR, dans l’esprit du projet GO FAIR project. Cet article de Coles et al (2020) présente les réalisations du réseau.
L’IUPAC (International Union of Pure and Applied Chemistry) contribue avec CODATA et RDA au projet WorldFair dans sa déclinaison disciplinaire en chimie. Il a notamment conduit à l’élaboration de recueil de bonnes pratiques et d’un cookbook (IUPAC Fair Chemistry Cookbook) proposant des contenus d’autoformation et des tutoriels. Les livrables du projet sont également accessibles en ligne (WorldFAIR Project (D3.1) Digital recommendations for Chemistry FAIR data policy and practice). Dans le cadre du projet FAIRSpec, lancé en 2019, l’IUPAC a élaboré une liste de principes et de préconisations pour favoriser la FAIRisation des données de spectroscopie (Archibald et al., 2025). L’objectif est d’identifier des informations et des métadonnées devant être présentes quel que soit le format de données utilisé par les fournisseurs de matériel. La gestion FAIR des données relève d’un processus continu, dans lequel le contexte de collecte et la curation sont essentiels. Les standards doivent être pensés comme étant “modulaires, extensibles et flexibles”. Outre ces principes généraux, le projet expérimente un workflow de traitement des jeux de données permettant d’obtenir un “IUPAC FAIRData Collection” documenté.
Constitué en 2020, le consortium allemand NFDI(4Chem) poursuit son projet : fournir à la communauté scientifique une infrastructure permettant la collecte, la gestion et la diffusion de données FAIR. Le plan d’action du consortium dédié à la chimie pour 2025-2030 énonce ses objectifs et son plan d’action : “Our Vision: All Chemists Publish FAIR Data”. Chaque année, un prix est décerné pour récompenser le jeu de données le plus FAIR (FAIR4Chem). Voici un retour d’expérience d’une chercheuse, Prof. Dr. Daumann, ayant gagné ce prix.
Dans le domaine de la catalyse, plusieurs initiatives ont été lancées autour du projet NOMAD et les actions du UK Catalysis Hub (UKCH), dont l’une des actions relayées dans Catalysis Communications porte sur la création d’un portail indexant les données en catalyse. Le portail affichera un score permettant d’évaluer si le jeu de données est FAIR ou non.
Focus Physique
Des organisations, tel le CERN, font explicitement référence aux principes FAIR dans leur politique de science ouverte. Voir aussi ici.
En août 2025, l’ICFA (International Committee for Future Accelerators /Comité international pour les accélérateurs futurs) approuve et promeut les recommandations formulées par le groupe d’experts « Cycle de vie des données ». Ces Recommandations for Best Practices for Data Preservation and Open Science in HEP sont sur le site de l’IFCA dans une version visuelle et interactive.
La NASA, dans son article Beyond Fair: Engagement, Data Usability, and Open Community Productivity through the NASA Open Science Data Repository (2024), montre elle aussi l’enjeu de la fairisation des données de son entrepôt.
L’European Open Science Cloud (EOSC) Photon and Neutron Data Service (ExPaNDS) a publié en 2022 des recommandations pour la FAIRisation des données : lire Soler et al. (2022).
Dans sa politique de gestion des données, l’ESRF inclut les recommandations de PaNOSC FAIR Research Data Policy pour rendre FAIR les données ouvertes de l’ESR depuis 2024. voir : Favre-Nicolin, V. et al. (2024).
Pour la matière condensée, le consortium FAIRmat de la National Reasearch Data Infrastructure (NFDI) fournit à la communauté une infrastructure, des outils, des normes et un accompagnement pour rendre les données de recherche FAIR.
Focus sciences de l’environnement
PANGAEA, entrepôt en sciences de l’environnement, certifié entrepôt de confiance, a obtenu le score le plus élevé en termes de critères FAIR lors de l’évaluation par la Commission Européenne. Un wiki permet aux chercheurs de s’approprier les bonnes pratiques pour la description et la diffusion des données. Un article (Felder et al., 2023) publié dans Scientific Data expose de manière très complète l’organisation de PANGAEA.
Le portail EPOS, the European Plate Observing System et notamment Epos-France qui met à disposition l’inventaire des données et métadonnées du centre de données sismologiques, appliquent également les recommandations FAIR. conformément aux normes internationales établies par la Federation of Digital Seismograph Networks (FDSN), ce qui facilite leur utilisation.
Le sixième rapport d’évaluation (AR6) du Groupe d’experts intergouvernemental sur l’évolution du climat (IPCC) a adopté les principes FAIR. Dans un article publié sur la revue Nature, la mise en œuvre des principes FAIR à travers l’entrepôt Atlas est expliquée.
Codes et logiciels de recherche
Les premières déclinaisons des principes FAIR appliqués aux logiciels de recherche ont été publiées en 2022 dans un article de Scientific Data[Introducing the FAIR Principles for research software] à la suite des travaux menés dans le cadre du groupe de travail FAIR pour les logiciels de recherche (FAIR4RS), qui a été joint par la Research Software Alliance (ReSA), Future Of Research Communications and E-Scholarship (FORCE11) et la Research Data Alliance (RDA). Elles rendent compte des spécificités des logiciels : leur utilisation (ils sont exécutés), leur réutilisation (ils peuvent être modifiés, construits ou incorporés dans d’autres logiciels), l’importance de la gestion des versions et de leur environnement de développement.
Les principes FAIR appliqués aux logiciels intègrent notamment l’interaction entre logiciels via l’échange de données et/ou de métadonnées, et/ou via des interfaces de programmation d’applications (API), décrites par des standards.
Les principes FAIR for Research SOftware FAIR4RS 2 sont détaillés dans ce document et cet article de Wilhelm Hasselbring et al. (2020).
Le projet SoFAIR a pour objectif de faciliter la découverte et l’accès des logiciels que les chercheurs utilisent, développent ou partagent en reliant les publications aux logiciels, ce qui permet de répondre à deux des principes FAIR. Cette initiative collaborative internationale vise donc à améliorer la réutilisabilité des logiciels de recherche ouverts. Le projet s’appuie sur des sources très utilisées (CORE, Software Heritage, HAL) et des outils (GROBID) pour identifier les mentions de logiciels dans les publications et faciliter leur découvrabilité.
Pourtant, les principes FAIR sont-ils réellement appropriés dans le contexte des codes et logiciels ? Di Cosmo et al., (2025) répondent par la négative: “And so software comes with a double bind: like data, it supports the findings of a study and should be preserved and published. Yet it should also remain available and supported, and possibly be improved, over time. (…) Some programs have a weekly or even daily release cycle, making the FAIR approach impractical” . Cet article, Code beyond FAIR, revient sur les spécificités des logiciels au regard des principes FAIR.
Workflows
Les matériels (Hardware), instruments et infrastructures constituent des éléments essentiels de l’écosystème de recherche contribuant à la mise en œuvre d’une démarche FAIR.
Dès 2011, le CERN lance son initiative (Open Hardware) ainsi la licence libre OHL, la première concernant du matériel. Il implémente le principe suivant : quiconque doit être en mesure d’avoir accès à la documentation de la conception, aux schémas techniques, permettant de comprendre, étudier et reproduire un matériel. La technologie White Rabbit destinée au contrôle et à l’acquisition de données en physique des particules est un cas d’usage de ces principes développés au CERN.
Le CERN accueille la première réunion du Global Open Science Hardware (GOSH), en 2016, qui donne lieu à la rédaction d’un manifeste, soulignant l’importance du matériel dans une démarche scientifique expérimentale et de science ouverte (voir le manuel).
Créé en 2022, le groupe de travail de la RDA, FAIR4RH Interest Group, se consacre à la déclinaison des principes FAIR pour les matériels : définition d’un matériel scientifique. La déclinaison des principes FAIR est en cours, à la suite des travaux de Nadica Miljković et al, qui identifient à partir de cas d’usage des licences ouvertes, des entrepôts de confiance (tel Open Hardware Repository), des formats de métadonnées, des identifiants utilisés par des Open Hardware.
Les infrastructures de recherche et plateformes techniques jouent elles aussi un rôle essentiel dans la définition de procédures, la diffusion d’une culture FAIR, et bien sûr la génération et la gestion de données FAIR comme le soulignent Murphy et al (2025). Le projet ExPanNDS, par exemple, vise à mettre en place une politique de gestion des données FAIR pour les infrastructures de physique des particules. Plus d’information ici Autre retour d’expérience lancé aux Etats-unis, celui du National Center for Atmospheric Research. Une réflexion sur la FAIRisation des instruments a mis en évidence le besoin de développer des identifiants pérennes pour les instruments, des Research Resource Identifiers (RRIDs) ou des DOI. Ce rapport souligne l’intérêt d’identifier les équipements de façon unique, mais relève les difficultés d’implémentation et d’adoption d’un tel système (voir également ici).
Les principes FAIR pour l’IA ?
En 2022, l’Argonne National Laboratory a organisé un workshop intitulé “FAIR for Artificial Intelligence”. Plusieurs initiatives FAIR impliquant l’IA ont été présentées à cette occasion : FAIR4HEP (en physique des hautes énergies), ENDURABLE, HPC-FAIR (un framework pour gérer données et modèles utilisés dans différents contextes scientifiques), BioDataCatalyst. Cet article publié dans Scientific Data synthétise ces retours d’expérience.
Une IA FAIR repose sur des jeux de données d’entraînement FAIR et sur des modèles qui le sont aussi (modèles comportant un identifiant, des métadonnées et des instructions pour exécuter le modèle, mais aussi des métriques permettant d’évaluer la cohérence des prévisions et sa performance). Cela implique également le dépôt dans des entrepôts appropriés : ML Commons, Data and Learning Hub for Science, DLHub). Parallèlement, les travaux de l’OSI (Open Source Initiative) ont permis de définir des critères adaptés au contexte d”une IA “Open Source”, qui soit réutilisable, modifiable, partageable et qui puisse être étudiée. Trois groupes de critères sont énoncés concernant la description détaillée des données d’entraînement, l’ouverture de l’ensemble des codes et des paramètres utilisés (pondération et configuration du modèle). Une équipe de recherche de Google propose l’utilisation de Data cards pour documenter les données, dans le contexte de l’IA.
Dans un article publié sur ArXiv, des chercheurs proposent une définition pratique des principes FAIR dans le contexte des données et des modèles d’intelligence artificielle pour la recherche expérimentale en physique des hautes énergies.
- Trouvable : télécharger le modèle d’intelligence artificielle sur GitHub, GitLab ou BitBucket ;
- Accessible : avoir un protocole standard, ouvert, gratuit, pour récupérer un modèle à partir d’un identifiant ;
- Interopérable : les métadonnées décrivant le modèle d’intelligence artificielle doivent documenter de manière exhaustive tous les aspects de sa structure, de sa formation et de ses entrées ;
- Réutilisable : préciser les logiciels, les outils et les dépendances nécessaires pour invoquer de manière transparente le modèle d’intelligence artificielle.
Un article publié dans Scientific Data propose un exemple appliqué à la physique des Hautes énergies.Principes FAIR pour les modèles d’intelligence artificielle.

Ressources pour la FAIRisation de données
Check-lists et fiches pratiques
- Le minimum à FAIR indique à chaque étape du cycle de vie des données, les points de vigilance et des conseils pratique pour rendre ses données FAIR.
- UtrechtUniversity / FAIR-Cheat Sheets (Université d’Utrecht) : fiches pratiques pour données et les codes
Outils d’évaluation généralistes
Plusieurs outils permettent de percevoir à quel degré les données de la recherche respectent les principes FAIR :
- How FAIR are your data? (EUDAT), check-list pour évaluer simplement la compatibilité de ses données avec les principes FAIR.
- FAIR self assessment tool (Australian Research Data Commons-ARDC) : outil organisé en 4 sections, avec conseils, fenêtres contextuelles, et pourcentage d’alignement du jeu de données sur les principes FAIR.
- Outil de DoraNum pour évaluer la maturité FAIR des données, logiciels et artefacts sémantiques.
- FAIRIST est un outil d’enquête pour tous les types d’objets de recherche, y compris les notes et les modèles d’apprentissage automatique. Voir cet article
- FAIR assessment ou F-UJI Automated FAIR Data Assessment Tool est un service web permettant, à partir d’une url ou d’un doi, d’évaluer de manière très visuelle la conformité FAIR des jeux de données de recherche sur la base d’indicateurs (disponibles sur Zenodo). Lire ici.
- FAIR-Checker : outil automatique pour évaluer la FAIRisation des données, en bio-informatique. Les utilisateurs sont informés des métadonnées manquantes. Pour plus d’information, lire cet article.
- FAIR-enough : outil automatique et partiellement configurable développé par Institute of Data Science at Maastricht University en 2022
Avec le développement de l’IA générative, des outils ont été développés pour assister les chercheurs à la FAIRisation de leurs données. Ils sont souvent encore en phase expérimentale (tel, cet outil). Ces outils sont à envisager avec prudence: les données relatives à votre projet risquent-elles d’être divulguées ou réutilisées pour alimenter le modèle ? Les informations produites sont-elles exactes ou hallucinées ? Quel est le coût environnemental de l’usage de cet outil ?
Des sites
De nombreux sites permettent d’approfondir la notion des principes FAIR et proposent des ressources de formations et de sensibilisation.
- How to FAIR ?, site publié par les universités danoises avec le soutien de la Research Data Alliance. Pages et modules de E-learning comme par exemple sur le format des fichiers, les métadonnées, les licences, les identifiants, l’accès aux données, etc. De nombreux exemples d’application dans un contexte de recherche et des retours d’expérience de chercheurs permettent d’appréhender concrètement les principes FAIR.. A noter : le contenu du site (textes, transcription des entretiens, images) sont accessibles sur Zenodo et réutilisables.
- FAIR sharing. Site multidisciplinaire très complet. Il recense les standards et les entrepôts compatibles avec les principes FAIR ainsi que les exigences ou recommandations des financeurs. Par exemple, FAIRsharing.org: ThermoML; ThermoML, DOI:10.25504/FAIRsharing.7b0fc3.
Des jeux
- Faut pas s’en FAIR : une extension du jeu coopératif GopenDoRe pour apprivoiser les principes FAIR
- Principes FAIR : Jeu coopératif pour comprendre comment rendre ses données le plus FAIR possible (dans le domaine de l’écologie)