Gérer ses données, tous concernés !

Les éditeurs

Quelles sont les exigences réelles des revues en physique et chimie en matière de partage des données ? Tour d’horizon des sociétés savantes et des éditeurs généralistes.

Sommaire

Faisant référence à la crise de la reproductibilité, Tsuyoshi Miyakawa, éditeur en chef  de Molecular Brain indique avoir écarté 40 articles sur 181 en deux ans, faute de données permettant d’étayer les conclusions (1).

En 2019, une étude intitulée “Effect of impact factor and discipline on journal data sharing policies” s’est penchée sur les politiques de partage des données de  447 journaux issus de différentes disciplines en lien avec les sciences médicales. Seules 12 d’entre elles, soit 2,7 % de l’échantillon, ont une politique maximaliste en faisant du partage des données une condition de publication. 

Deux facteurs peuvent influencer l’adoption de standards élevés en matière de partage des données. D’une part, le facteur d’impact. Les revues ayant un facteur d’impact élevé ont plus tendance à insister sur la reproductibilité et la soumission des données au processus d’examen par les pairs (2). D’autre part, la discipline. Sur 150 revues examinées en 2015 dans une étude portée par COPE, 30% des revues en sciences biomédicales affichent une politique très volontariste en matière de partage des données, contre 10% des revues en sciences physiques et chimie, par exemple.
Parmi les éditeurs de revues en physique et chimie, les disparités d’exigences et d’ambition en matière de publication et de vérification des données sont réelles. Nous vous proposons ci-après une description synthétique des pratiques actuellement à l’oeuvre au sein des sociétés savantes et des éditeurs généralistes.

LES SOCIÉTÉS SAVANTES

American Chemical Society

Depuis février 2020, ACS a mis en place une plateforme visant à faciliter le dépôt de données de RMN (Résonance Magnétique Nucléaire) selon les principes FAIR. Pour l’instant, seules deux revues en chimie organique, Journal of Organic Chemistry et Organic letters, participent à ce projet pilote en invitant les auteurs à recourir à ce service pour déposer leurs fichiers FID. A ce stade, les données ne sont pas stockées sur les serveurs d’ACS, même si cette perspective fait partie des pistes de développement du projet.
Pour chacune des 68 revues publiées par ACS, des consignes sont mises à disposition dans le Centre de publications. Les recommandations générales sur les données de RMN sont publiées ici. Les données de cristallographies doivent faire l’objet d’une vérification à partir de l’outil CheckCIF. Une liste des formats de fichiers acceptés pour les « supporting information » est aussi proposée.
Pour explorer, plus en détail, la politique de chaque revue, il faut se reporter au menu déroulant et consulter la notice concernant les « supporting information » et « data requirements ». D’une revue à l’autre, les pré-requis peuvent varier fortement : 

  • Le Journal of the American Chemical Society y consacre un développement de huit pages au sein de son guide à destination des auteurs. 
  • Le Journal of Organic Chemistry fournit également un mode d’emploi plutôt copieux. On peut notamment y lire : « Les éditeurs souhaitent souligner que la présentation de rendements supérieurs à 95%, de ratios isomériques au-dessus de 200 :1 et d’excès énantiomérique de plus de 99% ne sont pas réalistes sans explication détaillée ».
  • Le Journal of Proteome Research insiste quant à lui sur l’obligation, pour les auteurs, de déposer les données brutes et métadonnées associées dans des entrepôts comme ProteomeXchange et de fournir les modalités d’accès dans le manuscrit (URL voire mots de passe si nécessaire). « Les données resteront confidentielles pendant que le manuscrit est examiné mais elles seront rendues publiques une fois qu’il sera publié. »
  • La revue ACS Nano présente dans ses instructions aux auteurs ses “data requirements” ; les auteurs doivent notamment fournir des preuves solides pour établir à la fois l’identité et la pureté des nouvelles substances étudiées. Les spécifications attendues en fonction des types de données sont précisées.
Royal Society of Chemistry

RSC affiche une politique claire et détaillée : « Lors de la soumission d’un manuscrit, les auteurs doivent fournir toutes les données nécessaires pour comprendre et vérifier la recherche présentée dans l’article ».
Selon la nature des données, les consignes peuvent différer : les données de cristallographie aux rayons X doivent être déposées dans un entrepôt dédié. Les composés chimiques ainsi que les spectres peuvent quant à eux être inclus dans les « supporting information ». Les données dites « additionnelles », non-obligatoires mais pouvant être utiles pour alimenter de futures recherches, peuvent être déposées dans un entrepôt disciplinaire ou généraliste.

Les données spectrales doivent être fournies au format JCAMP-DX. Un guide détaillé est proposé pour faciliter la description des substances à travers une dizaine de critères (rendement, point de fusion, spectres, indice de réfraction etc.) Les données cristallographiques doivent bien sûr être au format CIF et assorties d’un rapport checkCIF.

A ces directives générales, les 44 revues publiées par RSC peuvent ajouter leurs propres recommandations, selon les domaines couverts. La revue ChemComm enjoint par exemple aux auteurs de fournir une description complète des conditions dans lesquelles les mesures magnétiques des échantillons ont été recueillies (type de capsule utilisée etc). La revue Energy & Environmental Science requiert quant à elle des informations fines sur le protocole de calibrage des convertisseurs solaires.

American Institute of Physics

AIP publie 32 revues, des proceedings et des ouvrages
AIP recommande aux auteurs de déposer leurs jeux de données dans des entrepôts accessibles au public ou de les présenter dans le manuscrit principal, afin que les lecteurs puissent avoir accès à tous les jeux  de données sur lesquels s’appuient les conclusions de l’article. La politique d’AIP sur les données de la recherche est accessible ici.
Au moment de la soumission de l’article, l’auteur doit fournir une “déclaration de disponibilité des données” (voir : Download Data Availability Statement Templates).
Les revues s’alignent globalement les recommandations générales d’AIP et n’adoptent pas de standards propres, contrairement aux revues d’ACS, par exemple.

Institute Of Physics

IOP publie 96 journaux et des “conference series. IOP participe au Committee for Publication Ethics (COPE).
Politique générale : « IOP Publishing soutient les principes de transparence et d’ouverture des données. Il s’agit d’un enjeu de reproductibilité. Pour cela, les données, les codes et les matériaux de recherche sur lesquels s’appuient les articles de recherche doivent être disponibles. » La politique est disponible ici. Deux aspects sur les standards et la disponibilité des données sont détaillés : Standard data policy et Data availability policy.
Toutes les revues éditées par IOP suivent ces préconisations. Il est cependant nécessaire de consulter les éventuelles politiques spécifiques des différentes revues, répertoriées dans la section « à propos de la revue » de leur site web. 
Supplementary materials : les fichiers des supplementary materials ne peuvent dépasser 10 Mo chacun.  Il est recommandé aux auteurs de déposer les fichiers de taille supérieure dans un entrepôt de données.

Modalités de mise à disposition : IOP recommande la publication dans un entrepôt disciplinaire ou, à défaut, généraliste.  Les entrepôts cités par IOP sont : Figshare, Dryad, Harvard Dataverse, Zenodo. A noter : IOP Publishing a développé un entrepôt dédié sur Figshare (voir : dedicated repository on the Figshare platform), utilisé par les revues Environmental Research Letters, IOP SciNotes, JPhys Complexity, Machine Learning: Science and Technology.

Ces revues ont une politique rendant obligatoire la déclaration de disponibilité des données (data availability statement) disponible ici.

Cas particulier :  toute revue que IOP Publishing publie au nom d’une autre société ou organisation peut avoir sa propre politique sur les données de recherche. C’est le cas des revues de l’American Publishing Society par exemple, qui disposent d’un data guide” disponible ici.

American Physical Society

APS publie 15 journaux dont Physical Review A, B, C, D, E, Physical Review Letters, Reviews of Modern Physics, Physical Review Applied. La politique d’APS sur la diffusion des données est seulement développée pour les “Supplemental Material”, archivés par l’éditeur et qui peuvent comprendre “des fichiers multimédia, des tableaux de données brutes ou analysées, des paramètres utilisés dans ou produits par des calculs et des codes informatiques” ainsi que des informations sur la manière dont la recherche a été menée (préparation des échantillons, dérivations, etc.). 
Tous les fichiers relatifs à un article sont stockés sous la forme d’un dépôt unique et se voient attribuer une adresse URL pour les documents complémentaires. Cette URL apparaît dans la liste des références de l’article.

Society of Photo-Optical Instrumentation Engineers

Société savante publiant 11 revues spécialisées dans l’étude de la lumière, SPIE indique dans ses dispositions éthiques (SPIE Guidelines for Ethical Publishing), que “les résultats de la recherche doivent être conservés sous une forme permettant l’analyse et l’examen”.
A ce stade, l’organisation ne publie pas de jeux de données volumineux. En revanche, les auteurs peuvent signaler ces derniers dans leurs manuscrits à partir d’un lien renvoyant vers un entrepôt, indique la revue Applied of remote sensing. La revue Advanced Photonics précise quant à elle que la taille maximale cumulée des fichiers joints aux supplementary material ne peut excéder 100 Mo. 

American Geophysical Union

L’American Geophysical Union publie 22 journaux (via Wiley) dont Geochemistry, Geophysics, Geosystems, Reviews of Geophysics ou JGR: Solid Earth
Cet organisme a adopté une politique sur la publication des données dès 1993. En 2015, l’American Geophysical Union déclarait : « Les données des sciences de la terre et de l’espace devraient être largement accessibles sous de multiples formats et que la préservation à long terme des données est une responsabilité intégrale des scientifiques et des institutions qui les parrainent ». Dans sa politique, l’AGU exige donc que “toutes les données nécessaires pour comprendre, évaluer, reproduire et développer la recherche rapportée doivent être rendues disponibles et accessibles chaque fois que cela est possible”. Les revues de l’AGU suivent les principes des FAIR data (cf guidelines for enabling FAIR data publiés par la COPDESS, Coalition for Publishing Data in the Earth and Space Sciences)

Il est donc recommandé aux auteurs d’identifier et archiver les données liées à leur article dans un entrepôt largement utilisé dans la communauté, de les conserver sur une durée d’au moins cinq ans ou d’y donner accès selon un processus clair. En cas de non-respect de ces clauses l’AGU se réserve le droit de refuser la publication. 
Les auteurs disposent d’instructions très complètes, avec par exemple des modèles permettant d’indiquer la disponibilité des données, les types d’entrepôts recommandés, etc.

European Geosciences Union

EGU, qui publie 19 revues en open access comme Geoscientific Model Development ou Atmospheric Chemistry and Physics (ACP), est signataire de la déclaration de Berlin en 2003 et en mars 2020, a approuvé l’initiative Open Access 2020. EGU a précisé quelques éléments sur les données massives (big data) et les sciences de la terre.

LES EDITEURS GÉNÉRALISTES

Les grands éditeurs de revues scientifiques (Elsevier, Springer Nature, Taylor and Francis ..) comme des éditeurs spécialisés ont mis en place une politique sur l’accès et la diffusion des données liées aux articles publiés dans leurs revues.

Springer Nature

Le groupe Springer Nature, (qui édite notamment Nature Physics, Nature Chemistry, Nature Materials, Nature Photonics, La Rivista del Nuovo Cimento) classe ses revues selon quatre catégories, selon le type de politique adoptée en matière de partage des données. Seules les catégories 3 et 4 imposent la communication des données, avec examen par les pairs dans le dernier cas. La plupart des revues en chimie sont classées en catégorie 2, signifiant ainsi que les auteurs peuvent fournir des informations sur la disponibilité des données (data availibility statement) et sont encouragés à déposer ces dernières dans un entrepôt ou dans les supplementary information.
A noter que Nature Physics et Nature Chemistry sont en revanche classées en catégorie 3. Dans ce cas, toutes les données pertinentes, y compris les données brutes, doivent être librement mises à disposition. La déclaration de disponibilité des données devient obligatoire.
L’éditeur met également à disposition une liste d’entrepôts recommandés par discipline. 

Elsevier

“Notre politique consiste à encourager les auteurs à partager leurs données de recherche plutôt que de leur imposer”, indique l’éditeur. Parmi les entrepôts potentiels, Elsevier recommande le sien, Mendeley data, ainsi qu’une soixantaine d’autres entrepôts plus spécifiques. Il fait également mention du cahier de laboratoire électronique Hivebench qu’il détient, traduisant ainsi son intention de créer des produits commercialisés pour chaque étape du processus de recherche.
Les revues d’Elsevier renvoient de manière uniforme à la déclaration de disponibilité des données que les auteurs sont invités à fournir et à la politique globale du groupe. Pour le Journal of Computational Physics, la co-soumission à Data In Brief est également proposée. En chimie, les données peuvent être mises en avant dans Chemical Data Collections.

Wiley

Chez cet éditeur, le degré d’exigence peut varier fortement, selon si la revue « encourage » le dépôt de données, l’exige, voire requiert du peer-reviewing de celles-ci. Wiley a un partenariat avec Dryad, un entrepôt payant, pour le dépôt des données. Certaines de ses revues, dans le domaine des sciences médicales ou environnementales, prennent en charge les frais afférents.
De manière générale, une “déclaration sur la disponibilité des données” est demandée aux chercheurs, qui pourront préciser si celles-ci sont en accès libre dans un entrepôt, sont au contraire soumises à un embargo ou sont disponibles sur demande. Une FAQ donne un peu plus de détails sur ce qui est attendu des auteurs en matière de données.
Dans le détail, il est nécessaire de se pencher sur les politiques mises en place dans chacune des revues. 

Angewandte Chemie International Edition, tout comme Chemistry, a European journal, proposent tous deux un mode d’emploi assez détaillé selon le type de données à fournir (spectroscopie RMN, infrarouge, de masse, catalyse, méthode précise utilisée pour la conversion et le stockage d’énergie etc.)

A l’inverse, Polymers for Advanced Technologies n’est pas très disert sur le sujet, indiquant simplement qu’un article ne peut contenir plus de 5 graphiques, les autres devant être placés dans les “supplementary information”. 

Taylor and Francis

Cet éditeur propose un éventail de revues dont les politiques en matière de communication des données peuvent osciller entre le facultatif et l’impératif. Comme pour Wiley, une déclaration sur la disponibilité des données est demandée aux auteurs. 
Des critères plus poussés existent pour 7 revues en géosciences, où le dépôt des données dans des entrepôts adaptés est obligatoire. Comme pour ACS, un partenariat a été noué avec Figshare, qui accueille les “supplementary information” des articles. 
L’examen de la plupart des revues en chimie montre que deux éléments reviennent de manière récurrente. D’une part, l’éditeur requiert l’assignation d’un DOI pour les jeux de données qui seraient éventuellement associées à l’article. D’autre part, il signale l’absence de peer-reviewing de celles-ci. “Il est de la responsabilité de l’auteur de s’assurer de la validité des données”, peut-on lire.

EDP Science

La politique de EDP Science, éditeur qui met en valeur son engagement dans la science ouverte, détaille sa politique sur le partage des données, en l’inscrivant dans le contexte du financement de la recherche : « Les revues d’EDP Sciences encouragent les auteurs à partager et à rendre les données si cela est légalement et éthiquement possible. »
Les auteurs sont encouragés à déposer leurs données dans un entrepôt en ligne, « les rendant disponibles pour la lecture humaine et automatique, afin de contribuer à l’accélération des découvertes scientifiques ». Ils sont invités à déposer leurs données conformément aux principes de données FAIR et sont encouragés à fournir une déclaration de disponibilité des données. Les revues Acta acustica, Astronomy & Astrophysics, Journal of Space Weather and Space Climate, sont concernées par ces recommandations.

Cambridge University Press

S’inscrivant dans les principes de transparence, la revue Journal of Fluid Mechanics publiée par Cambridge University Press indique dans sa rubrique “research transparency” ses exigences en matière de données de la recherche  : toutes les informations nécessaires pour reproduire l’étude doivent être fournies, soit dans le corps du document, soit dans des dépôts accessibles au public.

Un moteur de recherche pour noter la transparence des revues sur les données

Le Centre pour la science ouverte publie une grille d’analyse du taux de transparence et d’ouverture des revues. Ce guide distingue 8 thèmes (Citation Standards, Data Transparency, Analytic Methods (Code) Transparency, Research Materials Transparency, Design and Analysis Transparency, Study Preregistration) et 3 niveaux de compatibilité. Un moteur permet de vérifier la compatibilité d’une revue avec ces principes. En deux clics, on constate que Nature Chemistry (Springer) récolte 9 points, contre 1 point seulement pour Forensic Chemistry (Elsevier).

  1. Miyakawa, T. No raw data, no science: another possible source of the reproducibility crisis. Mol Brain 13, 24 (2020). https://doi.org/10.1186/s13041-020-0552-2
  2. Cela viendrait du fait, selon les auteurs de l’étude, que les “revues ayant un haut facteur d’impact ont tendance à recevoir plus d’attention de la part des chercheurs et des médias », induisant une pression accrue pour adopter des mesures.