Actualités - Actu en bref

Bulletin de veille – Septembre 2022

L’actualité dans vos domaines

Mener un projet de science citoyenne en science de l’environnement : cas d’usage et bonnes pratiques. Un article publié dans Nature Review Methods Primers identifie les différentes étapes d’un projet de science participative en sciences de l’environnement. Il référence notamment des outils et des guides existants pour mettre en place un projet de ce type. Pour la gestion des données, les auteurs indiquent un certain nombre de plateformes déjà ouvertes pour recueillir des données comme iNaturalist ou Sensor Community. Sont abordées également les questions liées à l’évaluation et au contrôle de la qualité des données récoltées. Une des conditions incontournables pour permettre la réutilisation des données est évidemment la description des données. Jusqu’à quel niveau de granularité faut-il aller ? Les auteurs évoquent la norme PPSR (Public Participation in Scientific Research) conçue pour la science participative, ainsi bien-sûr que DarwinCore. La diffusion des données sur des entrepôts généralistes ou thématiques comme GBIF, le dépôt des codes éventuellement associés aux développements mis à disposition des citoyens ainsi que la question des licences sont également abordées.

“Organic Chemistry” bientôt en open access. John McMurry, professeur émérite à Cornell et auteur d’un best seller de la chimie organique (Organic Chemistry) va faire paraître la 10e édition de son ouvrage en open access. Selon une clause de son contrat d’édition avec Cengage Learning, le copyright revient à son auteur 30 ans après la première impression. Il a choisi de publier son manuel sur Openstax, plateforme initiée par Rice University et financée notamment par les fondations Bill & Melinda Gates et Hewlett.

Big Data et la recherche sur le cancer. Le big data dans ce domaine est défini comme un ensemble de données présentant deux propriétés de base : il contient un volume très important d’informations susceptible de donner un nouvel éclairage sur des questions essentielles, et l’analyse exige une infrastructure informatique de grande envergure. Dans un article de Nature Reviews, les auteurs présentent différents cas où l’utilisation des big data et des technologies d’intelligence artificielle a permis de réaliser des avancées significatives dans la compréhension de base de la biologie du cancer. Par exemple, l’utilisation de l’IA pour l’analyse des données d’imagerie permet d’identifier et de classer les tumeurs à partir de tissus colorés.

Quel usage de l’European Registry of materials identifier ? Le CAS registry number (Chemical Abstract) et l’InChi de l’IUPAC sont des standards largement utilisés pour identifier des substances. A-t-on besoin de créer de nouveaux identifiants ? Lors de la création de l’European Registry of materials (ERM) identifier, en 2019, la question s’est posée. Les identifiants standards ne couvrent pas l’ensemble des besoins de l’ingénierie des nanomatériaux, notamment celui de signaler très en amont un nouveau matériau, avant même d’en connaître la structure et les propriétés précises. Un article du Journal of Cheminformatics fait un premier bilan sur l’utilisation de ce nouvel identifiant dans plusieurs projets (cluster européen NanoSafety, RiskGONE ou Gov4Nano). Favorisant les pratiques FAIR, l’usage de cet identifiant ne pourra se développer qu’avec la publication des données qui l’utilisent.

NifTI-MRS – un format standard pour la spectroscopie par résonance magnétique. La multiplicité des formats de spectroscopie par résonance magnétique (SRM) limite le partage et l’intégration des données. Extension du format du NIfTI (Neuroimaging informatics technology initiative), le format  NifTI-MRS pourrait devenir un standard. Un article publié dans la revue Magnetic Resonance in Medicine, présente une description des spécifications, un programme de conversion open source facilitant la conversion vers d’autres formats. Plusieurs exemples de jeux de données et une documentation complète en ligne sont également proposés.

Rendre les Digital Objects FAIR en physique des hautes énergies. Des chercheurs de l’Université de l’Illinois décrivent dans un article sur arXiv le développement d’un outil de FAIRification dédié aux Digital Objects dans le domaine de la physique des hautes énergies, comme par exemple de grands ensembles de données obtenus à partir du fonctionnement d’un détecteur ou de simulations Monte Carlo. Ce travail ouvre la voie au développement d’outils de FAIRification automatiques et personnalisés pour les Digital Objects utilisés dans la recherche en physique des hautes énergies, qui peuvent servir de guide pour établir des pratiques similaires dans d’autres domaines. Cliquez ici pour avoir plus d’informations.

Présentation de la plateforme VISA. VISA est une plateforme développée par ILL qui permet l’accès et l’analyse de données expérimentales à distance. Elle a été mise en place dans le cadre des projets PaNOSC et ExPaNDS, et elle est maintenant open source. Une vidéo de présentation de la plateforme est consultable ici. Pour avoir plus des renseignements sur les outils pour la gestion des données adaptés à la communauté Photon et Neutron consulter le Bulletin de veille – Avril 2022.

L’ouverture des données favorise-t-elle la détection des erreurs ? Non, répondent deux chercheurs de l’Université d’Ottawa dans une communication publiée dans Nature Ecology&Evolution. Les auteurs ont constitué une base de données recensant la politique en matière d’ouverture des données de près de 200 revues dans le domaine de l’écologie et de l’évolution. Ils n’ont pu mettre en évidence de corrélation avec le taux de correction ou de rétractation des articles et la politique en faveur de la science ouverte affichée par ces titres. Pourquoi ce résultat contre intuitif ? S’ils sont fournis, les jeux de données sont souvent incomplets ou inutilisables. Le manque d’ouverture ou l’absence du code utilisé constituent des freins à la réplication et à la détection d’erreur. Celle-ci n’est d’ailleurs pas valorisée par le système éditorial car elle risque d’entacher la réputation d’une revue.

Institutions

Politiques et infrastructures pour organiser les métadonnées. Ces dernières années, plusieurs agences de financement et instituts de recherche ont mis en place de nouvelles politiques de gestion des données pour rendre les données FAIR. Mais ce n’est pas suffisant. Les organismes de financement doivent aller au-delà des simples mandats pour les données FAIR. Des politiques et des infrastructures doivent être mises en place pour bien organiser et standardiser les métadonnées. Donc, des nouveaux investissements sont nécessaires. Ceci est le thème abordé par le professeur Musen de l’Université de Stanford dans un article sur Nature.

Des classes virtuelles pour utiliser Recherche Data Gouv. Le Centre de ressources entrepôt-catalogue propose régulièrement des classes virtuelles accessibles sans inscription pour déposer des données dans Recherche Data Gouv ou pour administrer une collection. Les séances durent deux heures. Le calendrier est accessible ici.

Réforme de l’évaluation scientifique. Le 28 septembre, lors des European Research and Innovation Days, la commission européenne, en présence de la ministre Sylvie Retailleau, a lancé le processus de signature de l’Agreement on Reforming Research Assessment publié le 20 juillet dernier. Le CNRS fait partie des premiers signataires, en cohérence avec sa feuille de route Science ouverte. L’accord prévoit la création d’une coalition pour une réforme qualitative de l’évaluation de la recherche.

La 2e assemblée des partenaires du CCSD. L’assemblée des partenaires s’est déroulée le 7 juillet et fait l’objet d’un compte-rendu dans le blog du CCSD. Instance de la nouvelle gouvernance du CCSD, aux côtés du comité de pilotage, du comité d’orientation et du conseil scientifique international, elle permet de réunir les représentants des 132 établissements ayant un portail HAL. C’est l’occasion d’échanger, relayer les attentes et les besoins des utilisateurs de HAL. La modération des dépôts dans HAL, les modalités de diffusion de l’information et de formations des différents acteurs, notamment via les webinaires Parlons Science Ouverte ont été abordées. Un des ateliers abordait également la question fondamentale du lien entre publication et données.

HALiance, un nouveau projet ambitieux pour le CCSD. Le dernier billet de blog du CCSD revient sur le lancement de ce projet, retenu dans le cadre appel à projets Équipement structurant pour la recherche (Equipex+) et décliné en plusieurs work packages. Plusieurs services sont ainsi prévus :

  • Enrichir HAL : il s’agira de repérer les publications scientifiques et d’obtenir l’accord des chercheurs pour l’import de ces publications dans HAL
  • Relier HAL à des dispositifs de relecture des preprints
  • Renforcer le lien entre publications et données associées à ces publications : un repérage automatique des données déjà déposées sera proposé et permettra d’associer à une publication présente dans HAL l’identifiant et la citation des données associées. Un service permettra de transférer un jeu de données vers un entrepôt adapté

Édition 2022 de l’appel à projets « Science avec et pour la société » de l’ANR. S’inscrivant dans le cadre du plan d’action 2022 de l’ANR, cet appel à projet vise à apporter un soutien financier à des problématiques scientifiques élaborées en partenariat, par des acteurs académiques et des acteurs non-académiques, autour d’enjeux de société. Les projets retenus seront dotés d’une enveloppe de 250 mille euros par projet, pour un financement sur  2 ans maximum. La date limite pour la soumission des projets est fixée au 17 octobre 2022.

Éditions scientifiques

Pour un changement radical dans l’édition scientifique. Dans un article d’opinion publié dans la revue eNeuro, Jean-Antroine Girault (INSERM), propose d’opérer un changement radical dans le fonctionnement de l’édition scientifique : valider les résultats de recherche et les données avant toute publication. Il propose la création d’une base de données de résultats (intégrant les résultats négatifs), et contenant toutes les métadonnées nécessaires à la reproduction et la comparaison des expériences. Certes, la mise en place d’un tel système supposerait, non seulement de lever les réticences des chercheurs à la diffusion des résultats avant publication, mais aussi de mettre en place un système de validation risquant d’allonger les délais de publication. L’auteur apporte des éléments de réponse à ces objections et détaille le processus de validation.

Une nouvelle version des bonnes pratiques dans la publication académique. Le Committee on Publication Ethics (COPE), le Directory of Open Access Journals (DOAJ), l’Open Access Scholarly Publishing Association (OASPA) et World Association of Medical Editors (WAME) ont publié la 4ème version des Principles of Transparency and Best Practice in Scholarly Publishing. Ces principes, publiés pour la 1ere fois en 2013, ont vocation à s’appliquer à tous les types de publication dont les proceedings. Pour la diffusion des données, il est recommandé que les éditeurs doivent inclure des politiques sur la disponibilité des données et encourager l’utilisation des recommandations et des standards de leur discipline.

Une vague de rétraction chez IOP. L’éditeur IOP (Institute of Physics) a rétracté 494 articles, une enquête interne ayant indiqué que certains articles “inauthentiquess” ont pu être créés, manipulés et/ou vendus par une entité commerciale. La grande majorité – 463 articles – sont issus du Journal of Physics : Conference Series. C’est la détection de similitudes entre articles d’auteurs différents qui a conduit l’éditeur à lancer la procédure, détaillée dans cet article sur Retraction Watch.

Projet Diamas : pour développer l’open access. Lauréat du second appel à projet Horizon Europe dans le cadre du programme Reforming and enhancing the European R&I System, le projet « Developping Institutional Open Access Publishing Models to Andance Scholarly Communication » (DIAMAS) a été lancé le 1er septembre 2022. Financé à hauteur de 2,6 millions d’euros pour 3 ans et coordonné par l’AMU (Aix-Marseille Université), ce projet rassemble 23 partenaires (dont le CNRS, Science Europe, la Fondation européenne pour la Science, SPARC) issus de 12 pays européens. Ce projet doit permettre de réaliser un état des lieux des acteurs impliqués dans la fourniture de services de publication institutionnels, d’élaborer une certification visant à labelliser les institutions ou encore de développer des outils (référentiels qualité, guides de bonnes pratiques, etc.) et des formations destinées aux acteurs de l’écosystème diamant. Ces dispositifs sont destinés à  faciliter la montée en compétence et l’homogénéisation des pratiques de publication des fournisseurs de service de publication  institutionnels. La conférence Open Access Diamond a donné lieu à une présentation des objectifs du projet et de sa structuration.

Oligopoles de l’édition scientifique : à qui profite l’open access ? 1,06 milliards de dollars : ce serait, d’après une étude canadienne, le montant des frais de publication (APC) collectés par les 5 principaux éditeurs académiques commerciaux (Elsevier, Sage, Springer-Nature, Taylor&Francis et Wiley) entre 2015 et 2018. Sur la base de données issues de nombreuses sources (Web of Science, Unpaywall, Wayback Machine d’Internet Archive, etc.) plus de 500 000 articles ont été analysés. Les auteurs estiment les montants respectivement payés pour le Gold Open Access à 612,5 et à 448,3 millions de dollars pour les revues hybrides – pour lesquelles, rappelons-le, des abonnements sont également payés par les bibliothèques. Springer-Nature, devançant Elsevier, s’accapare la part la plus importante de ces revenus liés à l’open access (soit 587 millions de dollars). Scientific Reports (Springer-Nature) à lui seul génère 105,1 millions de dollars de revenus, suivi par Nature Communications (71 millions de dollars). Les auteurs en concluent : « loin de rendre l’édition académique soutenable et accessible à tous, les APC élevés et les accords transformants semblent préserver le statu quo ».

Études et enquêtes

Comment et où les chercheurs du CNRS publient-ils ? Une enquête publiée par la Direction des données de la recherche (DDOR) répond à ces questions, et propose une photographie intéressante des pratiques de publications dans les labos du CNRS. Quelques chiffres ressortent : hors SHS, 17 éditeurs couvrent 80 % des publications scientifiques des laboratoires du CNRS (soit environ 48000 publications). Les publications de 2020, dont l’ouverture a été mesurée en 2021, sont à 77 % en accès ouvert soit une progression de 28 points en trois ans (au niveau national, selon le Baromètre Science Ouverte, ce taux est de 62%). 91% des publications de 2019 en accès ouvert sont disponibles dans des archives ouvertes, pratique très répandue en physique des particules et en astronomie. Parmi les 10 revues dans lesquelles les chercheurs publient le plus, on trouve plusieurs titres en physique et en chimie (Astronomy and Astrophysics, Physical review B, Physical review D, Physical Review Letters, Physical Chemistry Chemical Physics). Par ailleurs, le montant des APC payé par le CNRS en 2017 atteint près de 2 millions d’euros. Rappelons que le CNRS encourage les chercheurs à privilégier les modes de publications gratuits pour les auteurs et les lecteurs (ce qui correspond au modèle diamant).

Le Peer Review améliore-t-il le contenu statistique des manuscrits ? C’est la question à laquelle les auteurs tentent de répondre dans leur article paru le 23 Août dans Royal Society Open Science, à partir d’une enquête menée par des chercheurs de l’Université de Valence et de Milan. L’étude s’attarde sur la mesure de l’effet du peer review sur la façon dont les manuscrits évoluent de la soumission initiale à la version publiée. Ils ont examiné 27 467 manuscrits soumis à quatre revues de la Royal Society (2006-2017). Ils montrent que le nombre de contenus statistiques augmente pendant le processus d’évaluation par les pairs.

Guides et ressources

Des critères pour choisir un cahier de laboratoire électronique pertinent. Après le rapport sur les cahiers de laboratoires électroniques, le Groupe de Travail sur les Cahiers de Laboratoire électroniques du Comité Science Ouverte a publié une liste de critères de sélection sous la forme d’un tableau que chaque laboratoire peut adapter à sa situation. Parmi les critères proposés : les questions relatives à la sauvegarde des données, la confidentialité, l’interopérabilité, l’ergonomie, l’existence d’une communauté. 

Référentiel GreenData. Rédigé par OpenDataFrance et ses partenaires, ce guide propose 10 bonnes pratiques qui s’articulent autour du cycle de vie de la donnée dont le but est de limiter l’impact environnemental de l’ouverture des données : standardiser les jeux de données pour garantir leur interopérabilité, documenter précisément les métadonnées pour faciliter la gestion et la réutilisation des données, réduire le volume unitaire des données pour limiter le stockage des données et les flux d’échange, etc.

Commentaires

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *