Gérer ses données, tous concernés !

Les éditeurs

Quelles sont les exigences réelles des revues en physique et chimie en matière de partage des données ? Tour d’horizon des sociétés savantes et des éditeurs généralistes.

Sommaire

Faisant référence à la crise de la reproductibilité, Tsuyoshi Miyakawa, éditeur en chef  de Molecular Brain indique avoir écarté 40 articles sur 181 en deux ans, faute de données permettant d’étayer les conclusions (1).

En 2019, une étude intitulée “Effect of impact factor and discipline on journal data sharing policies” s’est penchée sur les politiques de partage des données de  447 journaux issus de différentes disciplines en lien avec les sciences médicales. Seules 12 d’entre elles, soit 2,7 % de l’échantillon, ont une politique maximaliste en faisant du partage des données une condition de publication. 

Deux facteurs peuvent influencer l’adoption de standards élevés en matière de partage des données. D’une part, le facteur d’impact. Les revues ayant un facteur d’impact élevé ont plus tendance à insister sur la reproductibilité et la soumission des données au processus d’examen par les pairs (2). D’autre part, la discipline. Sur 150 revues examinées en 2015 dans une étude portée par COPE, 30% des revues en sciences biomédicales affichent une politique très volontariste en matière de partage des données, contre 10% des revues en sciences physiques et chimie, par exemple.
Parmi les éditeurs de revues en physique et chimie, les disparités d’exigences et d’ambition en matière de publication et de vérification des données sont réelles. Nous vous proposons ci-après une description synthétique des pratiques actuellement à l’œuvre au sein des sociétés savantes et des éditeurs généralistes.

LES SOCIÉTÉS SAVANTES

American Chemical Society

Depuis février 2020, ACS a mis en place une plateforme visant à faciliter le dépôt de données de RMN (Résonance Magnétique Nucléaire) selon les principes FAIR. Pour l’instant, seules deux revues en chimie organique, Journal of Organic Chemistry et Organic letters, participent à ce projet pilote en invitant les auteurs à recourir à ce service pour déposer leurs fichiers FID. A ce stade, les données ne sont pas stockées sur les serveurs d’ACS, même si cette perspective fait partie des pistes de développement du projet.
Pour chacune des revues publiées par ACS, des consignes sont mises à disposition dans le Centre de publications. Les recommandations générales sur les données de RMN sont publiées ici. Les données de cristallographies doivent faire l’objet d’une vérification à partir de l’outil CheckCIF. Une liste des formats de fichiers acceptés pour les « supporting information » est aussi proposée.
Pour explorer, plus en détail, la politique de chaque revue, il faut se reporter au menu déroulant et consulter la notice concernant les « supporting information » et « data requirements ». D’une revue à l’autre, les pré-requis peuvent varier fortement : 

  • Le Journal of the American Chemical Society y consacre un développement conséquent au sein de son guide à destination des auteurs. 
  • Le Journal of Organic Chemistry fournit également un mode d’emploi plutôt copieux. On peut notamment y lire : « Les éditeurs souhaitent souligner que la présentation de rendements supérieurs à 95%, de ratios isomériques au-dessus de 200 :1 et d’excès énantiomérique de plus de 99% ne sont pas réalistes sans explication détaillée ».
  • Le Journal of Proteome Research insiste quant à lui sur l’obligation, pour les auteurs, de déposer les données brutes et métadonnées associées dans des entrepôts comme ProteomeXchange et de fournir les modalités d’accès dans le manuscrit (URL voire mots de passe si nécessaire). « Les données resteront confidentielles pendant que le manuscrit est examiné mais elles seront rendues publiques une fois qu’il sera publié. »
  • La revue ACS Nano présente dans ses instructions aux auteurs ses “data requirements” ; les auteurs doivent notamment fournir des preuves solides pour établir à la fois l’identité et la pureté des nouvelles substances étudiées. Les spécifications attendues en fonction des types de données sont précisées.
Royal Society of Chemistry

RSC affiche une politique claire et détaillée : « Lors de la soumission d’un manuscrit, les auteurs doivent fournir toutes les données nécessaires pour comprendre et vérifier la recherche présentée dans l’article ».
Selon la nature des données, les consignes peuvent différer : les données de cristallographie aux rayons X doivent être déposées dans un entrepôt dédié. Les composés chimiques ainsi que les spectres peuvent quant à eux être inclus dans les « supporting information ». Les données dites « additionnelles », non-obligatoires mais pouvant être utiles pour alimenter de futures recherches, peuvent être déposées dans un entrepôt disciplinaire ou généraliste.

Les données spectrales doivent être fournies au format JCAMP-DX. Des informations détaillées sont proposées pour faciliter la description des substances à travers une dizaine de critères (rendement, point de fusion, spectres, indice de réfraction etc.) Les données cristallographiques doivent bien sûr être au format CIF et assorties d’un rapport checkCIF.

A ces directives générales, les revues publiées par RSC peuvent ajouter leurs propres recommandations, selon les domaines couverts. La revue ChemComm enjoint par exemple aux auteurs de fournir une description complète des conditions dans lesquelles les mesures magnétiques des échantillons ont été recueillies (type de capsule utilisée etc). La revue Energy & Environmental Science requiert quant à elle des informations fines sur le protocole de calibrage des convertisseurs solaires.

American Institute of Physics

AIP publie (ou co-édite) 46 revues ou proceedings et des ouvrages
AIP recommande aux auteurs de déposer leurs jeux de données dans des entrepôts accessibles au public ou de les présenter dans le manuscrit principal, afin que les lecteurs puissent avoir accès à tous les jeux  de données sur lesquels s’appuient les conclusions de l’article. La politique d’AIP sur les données de la recherche est accessible ici.
Au moment de la soumission de l’article, l’auteur doit fournir une “déclaration de disponibilité des données” (voir : Download Data Availability Statement Templates).
Les revues s’alignent globalement les recommandations générales d’AIP et n’adoptent pas de standards propres, contrairement aux revues d’ACS, par exemple.

Institute Of Physics

IOP publie (ou co-édite) 108 journaux et des “conference series. IOP participe au Committee for Publication Ethics (COPE).
Politique générale : « IOP Publishing soutient les principes de transparence et d’ouverture des données. Il s’agit d’un enjeu de reproductibilité. Pour cela, les données, les codes et les matériaux de recherche sur lesquels s’appuient les articles de recherche doivent être disponibles. » La politique est disponible ici. Deux aspects sur les standards et la disponibilité des données sont détaillés : Standard data policy et Data availability policy.
Toutes les revues éditées par IOP suivent ces préconisations. Il est cependant nécessaire de consulter les éventuelles politiques spécifiques des différentes revues, répertoriées dans la section « à propos de la revue » de leur site web. 
Supplementary materials : les fichiers des supplementary materials ne peuvent dépasser 10 Mo chacun.  Il est recommandé aux auteurs de déposer les fichiers de taille supérieure dans un entrepôt de données.

Modalités de mise à disposition : IOP recommande la publication dans un entrepôt disciplinaire ou, à défaut, généraliste.  Les entrepôts cités par IOP sont : Figshare, Dryad, Harvard Dataverse, Zenodo. A noter : IOP Publishing a développé un entrepôt dédié sur Figshare (voir : dedicated repository on the Figshare platform), utilisé par les revues Environmental Research Letters, IOP SciNotes, JPhys Complexity, Machine Learning: Science and Technology.

Ces revues ont une politique rendant obligatoire la déclaration de disponibilité des données (data availability statement) disponible ici.

Cas particulier :  toute revue que IOP Publishing publie au nom d’une autre société ou organisation peut avoir sa propre politique sur les données de recherche. C’est le cas des revues de l’American Publishing Society par exemple, qui disposent d’un data guide” disponible ici.

American Physical Society

APS publie 18 journaux dont Physical Review A, B, C, D, E, Physical Review Letters, Reviews of Modern Physics, Physical Review Applied. Comme indiqué dans l’Editorial Policies and Practices (Data Avalaibility), les Physical Review encouragent vivement les auteurs à partager les données, codes, logiciels et autres éléments pertinents qui étayent leurs résultats en les déposant dans des entrepôts de données ouverts au moment de la publication. Les auteurs peuvent indiquer la disponibilité des données, des logiciels, des codes et d’autres matériels dans le paragraphe précédant les remerciements grâce à un Data Availability Statement.

Society of Photo-Optical Instrumentation Engineers (SPIE)

Société savante publiant 14 revues spécialisées dans l’étude de la lumière, SPIE indique dans ses dispositions éthiques (SPIE Guidelines for Ethical Publishing), que “les résultats de la recherche doivent être conservés sous une forme permettant l’analyse et l’examen”. Les instructions aux auteurs précisent que les revues SPIE exigent des déclarations de disponibilité des codes, des données et des matériaux pour tous les articles acceptés (Codes Data and Materials Avalaibility Statements). Cette exigence est entrée en vigueur le 1er mai 2023. Ces déclarations doivent décrire comment accéder à toutes les données nécessaires pour reproduire ou interpréter les résultats décrits dans l’article. Les auteurs sont encouragés à rendre les données et le code accessibles dans des entrepôts comme FigShare, Github, CodeOcean, etc.

American Geophysical Union

L’American Geophysical Union publie 23 journaux (via Wiley) dont Geochemistry, Geophysics, Geosystems, Reviews of Geophysics ou JGR: Solid Earth
Cet organisme a adopté une politique sur la publication des données très détaillée. L’American Geophysical Union déclarait dans sa Position Statement on Data : « Les données des sciences de la terre et de l’espace devraient être largement accessibles sous de multiples formats et que la préservation à long terme des données est une responsabilité intégrale des scientifiques et des institutions qui les parrainent ». Dans sa politique, l’AGU exige donc que “toutes les données nécessaires pour comprendre, évaluer, reproduire et développer la recherche rapportée doivent être rendues disponibles et accessibles chaque fois que cela est possible”. Les revues de l’AGU suivent les principes des FAIR data (cf guidelines for enabling FAIR data publiés par la COPDESS, Coalition for Publishing Data in the Earth and Space Sciences)

Il est donc recommandé aux auteurs d’identifier et archiver les données liées à leur article dans un entrepôt largement utilisé dans la communauté, de les conserver sur une durée d’au moins cinq ans ou d’y donner accès selon un processus clair. En cas de non-respect de ces clauses l’AGU se réserve le droit de refuser la publication. 
Les auteurs disposent d’instructions très complètes, avec par exemple des modèles permettant d’indiquer la disponibilité des données, les types d’entrepôts recommandés, etc.

European Geosciences Union

EGU publie 19 revues en open access (via Copernicus Publications), comme Geoscientific Model Development ou Atmospheric Chemistry and Physics (ACP). L’organisation est signataire de la déclaration de Berlin en 2003, a approuvé l’initiative Open Access 2020, est signataire du commitment statement de la Coalition on Publishing Data in the Earth and Space Sciences (COPDESS) et de l’Enabling FAIR Data Commitment Statement in the Earth, Space, and Environmental Sciences. Chaque revue demande dans sa « Data Policy » (par exemple ici) que les données correspondantes aux articles soient déposées dans un entrepôt de dépôts de données et qu’une déclaration de disponibilité des données soit présente dans le dernier paragraphe de chaque article. EGU a précisé quelques éléments sur les données massives (big data) et les sciences de la terre.

LES EDITEURS GÉNÉRALISTES

Les grands éditeurs de revues scientifiques (Elsevier, Springer Nature, Taylor and Francis ..) comme des éditeurs spécialisés ont mis en place une politique sur l’accès et la diffusion des données liées aux articles publiés dans leurs revues.

Springer Nature

Le groupe Springer Nature, (qui édite notamment Nature Physics, Nature Chemistry, Nature Materials, Nature Photonics, La Rivista del Nuovo Cimento) impose, dans sa politique standard, d’inclure une déclaration de disponibilité des données pour tout article publié. Cette déclaration doit indiquer quelles sont les données disponibles, où elles peuvent être trouvées et à quelles conditions, qu’il s’agisse de données originales ou réutilisées. Les auteurs sont fortement encouragés à déposer leurs données dans un entrepôt au moment de la publication. L’éditeur met à disposition une liste d’entrepôts recommandés par discipline. Pour certains types de données (comme les données de la protéomique, de la cristallographie des petites molécules, ou les structures macromoléculaires) le dépôt dans un répertoire public est obligatoire, accompagné d’une citation dans l’article comprenant l’identifiant pérenne du jeu de données.
Les rapporteurs peuvent demander l’accès aux données et au code, lorsqu’ils l’estiment nécessaire, lors de l’évaluation du manuscrit. Lorsque les données sont trop sensibles pour être partagées publiquement, les conditions d’accès aux données doivent néanmoins être stipulées dans l’article.
Le groupe affiche son ambition de voir l’ensemble de ses publications adopter cette politique standard. C’est déjà le cas pour les titres de BMC, Nature et Springer Open. La transition étant encore en cours pour les autres titres de Springer et Palgrave Macmillan, certains journaux peuvent encore avoir une politique des données moins stricte que celle exposée ici. 

Elsevier

“Notre politique consiste à encourager les auteurs à partager leurs données de recherche plutôt que de leur imposer”, indique l’éditeur. Parmi les entrepôts potentiels, Elsevier recommande le sien, Mendeley data, ainsi qu’une soixantaine d’autres entrepôts plus spécifiques.
Les revues d’Elsevier renvoient de manière uniforme à la déclaration de disponibilité des données que les auteurs sont invités à fournir et à la politique globale du groupe. Pour le Journal of Computational Physics, la co-soumission à Data In Brief et à SoftwareX est également proposée. En chimie, les données peuvent être mises en avant dans Chemical Data Collections.

Wiley

Chez cet éditeur, le degré d’exigence peut varier fortement, selon si la revue « encourage » le dépôt de données, l’exige, voire requiert du peer-reviewing de celles-ci. Wiley a un partenariat avec Dryad, un entrepôt payant, pour le dépôt des données. Certaines de ses revues, dans le domaine des sciences médicales ou environnementales, prennent en charge les frais afférents.
De manière générale, une “déclaration sur la disponibilité des données” est demandée aux chercheurs, qui pourront préciser si celles-ci sont en accès libre dans un entrepôt, sont au contraire soumises à un embargo ou sont disponibles sur demande. Une FAQ donne un peu plus de détails sur ce qui est attendu des auteurs en matière de données.
Dans le détail, il est nécessaire de se pencher sur les politiques mises en place dans chacune des revues. 

Angewandte Chemie International Edition, tout comme Chemistry, a European journal, proposent tous deux un mode d’emploi assez détaillé selon le type de données à fournir (spectroscopie RMN, infrarouge, de masse, catalyse, méthode précise utilisée pour la conversion et le stockage d’énergie etc.)

A l’inverse, Polymers for Advanced Technologies n’est pas très disert sur le sujet, indiquant simplement qu’un article ne peut,sauf si la compréhension de l’article en dépend, contenir plus de 5 graphiques, les autres devant être placés dans les “supplementary information”. Les données doivent être si possible rendues publiques mais ce n’est pas une obligation.

Taylor and Francis

Cet éditeur propose un éventail de revues dont les politiques en matière de communication des données peuvent osciller entre le facultatif et l’impératif. Comme pour Wiley, une déclaration sur la disponibilité des données est demandée aux auteurs. 
Des critères plus poussés existent pour 6 revues en géosciences, où le dépôt des données dans des entrepôts adaptés est obligatoire. Comme pour ACS, un partenariat a été noué avec Figshare, qui accueille les “supplementary information” des articles. 
L’examen de la plupart des revues en chimie montre que deux éléments reviennent de manière récurrente. D’une part, l’éditeur requiert l’assignation d’un DOI pour les jeux de données qui seraient éventuellement associées à l’article. D’autre part, il signale l’absence de peer-reviewing de celles-ci. “Il est de la responsabilité de l’auteur de s’assurer de la validité des données”, peut-on lire.

EDP Science

La politique de EDP Science, éditeur qui met en valeur son engagement dans la science ouverte, détaille sa politique sur le partage des données, en l’inscrivant dans le contexte du financement de la recherche : « Les revues d’EDP Sciences encouragent les auteurs à partager et à rendre les données si cela est légalement et éthiquement possible. »
Les auteurs sont encouragés à déposer leurs données dans un entrepôt en ligne, « les rendant disponibles pour la lecture humaine et automatique, afin de contribuer à l’accélération des découvertes scientifiques ». Ils sont invités à déposer leurs données conformément aux principes de données FAIR et sont encouragés à fournir une déclaration de disponibilité des données. Les revues Acta acustica, Astronomy & Astrophysics, Journal of Space Weather and Space Climate, sont concernées par ces recommandations.

Cambridge University Press

S’inscrivant dans les principes de transparence, la revue Journal of Fluid Mechanics publiée par Cambridge University Press indique dans sa rubrique “research transparency” ses exigences en matière de données de la recherche  : toutes les informations nécessaires pour reproduire l’étude doivent être fournies, soit dans le corps du document, soit dans des dépôts accessibles au public.

Un moteur de recherche pour noter la transparence des revues sur les données

Le Centre pour la science ouverte publie une grille d’analyse du taux de transparence et d’ouverture des revues. Ce guide distingue 10 thèmes (Data Citation, Data Transparency, Analysis Code Transparency, Materials Transparency, Design and Analysis Reporting Guidelines, Study Preregistration, Analysis Plan Preregistration, Replication, Registered Reports and Publication Bias, Open Science Badges) et 3 niveaux de compatibilité. Un moteur permet de vérifier la compatibilité d’une revue avec ces principes. En deux clics, on constate que Nature Chemistry (Springer) récolte 7 points, contre 1 point seulement pour Forensic Chemistry (Elsevier).

  1. Miyakawa, T. No raw data, no science: another possible source of the reproducibility crisis. Mol Brain 13, 24 (2020). https://doi.org/10.1186/s13041-020-0552-2
  2. Cela viendrait du fait, selon les auteurs de l’étude, que les “revues ayant un haut facteur d’impact ont tendance à recevoir plus d’attention de la part des chercheurs et des médias », induisant une pression accrue pour adopter des mesures.