Actualités - Actu en bref

Bulletin de veille – Janvier 2021

L’actualité dans vos disciplines…

Pratiques de gestion des données : où en sont les chimistes ? Réalisée auprès de chercheurs, post-docs et doctorants en chimie, l’enquête du consortium allemand NFDI4Chem indique que 17% des répondants sont utilisateurs de solutions dématérialisées de cahiers de laboratoire (la question était entendue au sens large, incluant également des logiciels de tableurs et traitement de texte). L’immense majorité des chercheurs (89%) disent travailler à partir de données produites ailleurs que par leur groupe de travail ou institut, mais le mode de partage de celles-ci reste très artisanal, essentiellement par email ou clé USB. En revanche, la plupart des chercheurs (70%) utilisant déjà des cahiers de laboratoire électroniques ont recours à ces derniers pour partager leurs données. Retrouvez les résultats de l’enquête en anglais et allemand.

Les publications en chimie et physique de plus en plus en open access. Selon le baromètre national de la science ouverte, qui vient d’être mis à jour, la part des publications en accès ouvert dans ces deux domaines a bondi de 42% à 48% et de 59% à 64% en l’espace d’un an. Au niveau national, 56% des 156000 publications scientifiques françaises parues en 2019 sont disponibles en accès ouvert. Ce chiffre est en nette augmentation (+7 points) par rapport aux publications datées de 2018. 

Cahiers de laboratoire : le témoignage d’un doctorant de l’IRCELyon. En dernière année de thèse de chimie à Lyon 1, Rémy Rajapaksha relate, dans deux vidéos tournées pour le projet Datacc, l’usage quotidien qu’il fait des cahiers de laboratoire. Trigramme, petit carnet, grand cahier, anecdote de stage… Découvrez son retour d’expérience ici (partie 1) et là (partie 2). 

Les archives de la Royal Society of Chemistry disponibles pour le data mining. Pas moins de 180 années de recherche et de découvertes scientifiques ont été numérisées par RSC au cours de ces dernières années. Cette démarche, qui vise à rendre la recherche accessible et réutilisable, renforce l’importance des travaux recourant au machine learning.

Rétractation de 68 articles chez RSC. L’éditeur a annoncé la rétractation de 68 articles issus de RSC Advances, RSC Medicinal Chemistry et Food and Function. Les articles en question obéissaient à la même structure sans pour autant faire mention d’auteurs en commun. L’un des problèmes majeurs repéré portait sur la manipulation des images associées aux articles. 

La disponibilité et la fiabilité des données, élément-clé pour l’intelligence artificielle en chimie pharmaceutique. L’édition de janvier 2021 de la revue Drug Discovery Today revient sur cet enjeu crucial pour les années à venir. Les investissements dans l’intelligence artificielle bondissent, avec un marché estimé à 5 milliards d’euros d’ici 2024, soit 25 fois plus qu’en 2015. Qu’ils s’agisse de prédictions de propriétés physico-chimiques ou de toxicité, les firmes pharmaceutiques estiment que le recours à l’IA permet de réduire les risques d’échec lors de la recherche de nouveaux médicaments. Mais le succès de l’IA “dépend de la disponibilité d’une quantité substantielle de données”. Or, l’accès à celles-ci via différentes bases de données peut induire des coûts supplémentaires et les données doivent être fiables et de haute qualité pour garantir l’exactitude des prédictions.” 

Gestion et accessibilité des données chez Pfizer. Le groupe travaille à la mise en place d’outils et méthodes améliorant la gestion des données quotidienne dans ses laboratoires : une bibliothèque centralisée de molécules accessible n’importe où, l’obligation d’associer des métadonnées aux jeux de données, une structuration des formats de données issus des divers instruments, puis l’utilisation de l’intelligence artificielle et du machine learning afin de fouiller dans toutes les données récoltées.

Améliorer l’interopérabilité des jeux de données : un exemple en sciences du vivant. Une équipe de l’INRAE a mis au point un processus de structuration de données expérimentales provenant de tableurs. Cette démarche appelée ODAM (Open Data for Access and Mining) fait intervenir des tableaux de métadonnées décrivant chaque variable et leur lien entre les différents jeux de données, à la manière d’une base de données relationnelle. L’interconnexion entre jeux de données, mais aussi à des applications telles que R ou Python pour l’analyse est rendue possible grâce à ces tableaux structurés.

Edition scientifique

Nature lance un nouveau mode de publication en open access. La revue Nature Physics souhaite expérimenter le “Guided Open Access”. Dans ce cadre, les auteurs scientifiques auront la possibilité de soumettre leurs publications de manière simultanée aux trois revues principales de Nature dans le domaine de la physique. Après évaluation des éditeurs, la publication sera ainsi attribuée à la revue la plus adéquate et le processus de reviewing pourra alors débuter. Cette nouvelle méthode de publication occasionne un coût supplémentaire de 2190 dollars, en plus des frais de publication, qui oscillent entre 800 et 2600 dollars par article.

Wiley annonce l’acquisition de Hindawi. La concentration dans l’édition scientifique se poursuit avec le rachat annoncé par Wiley de l’éditeur Hindawi pour un montant de 298 millions de dollars. Hindawi édite plus de 200 revues dont les articles sont diffusés en libre accès contre paiement d’APC. Parmi elles, de nombreux titres en Physique, sciences de l’ingénieur et huit revues en chimie ou biochimie.

La Houille Blanche rejoint Taylor and Francis. Depuis le 1er janvier, la revue spécialisée en hydroélectricité est désormais éditée par Taylor and Francis et non plus EDP Science. Si le libre accès aux publications reste de mise, il se fait après paiement de frais atteignant 1320 € par article.

Etudes

Étude comparative de sept services nationaux de données de recherche. Menée par la Comité pour la Science Ouverte, cette étude permet de faire le point sur les services mis en place en Allemagne, Australie, Norvège, Grande-Bretagne, Canada et Pays-Bas. Les aspects de gouvernance et de financement des plateformes (par les utilisateurs ou par les instances publiques) sont notamment étudiés. Les principaux services proposés sont tournés vers le dépôt de données et l’accompagnement au dépôt, puis la préservation de celles-ci dans le temps.

Les plans de gestion des données : une efficacité qui reste à prouver. Une étude australienne menée sur la base de 834 plans de gestion de données estime que la manière dont ces documents sont conçus ne permet pas de “créer une culture du changement” en matière de partage des données. Dans 63% des cas, les PGD ne permettent pas à une tierce personne de savoir où se trouvent les données ni comment y accéder. 

Institutions

Deux nouveaux guides de bonnes pratiques sur la gestion des données de recherche. Le groupe de travail « Atelier données » du CNRS vient de publier un guide des bonnes pratiques sur la gestion des données. Ce document en 7 parties offre une documentation très fournie sur les différents aspects et pratiques relatives à la science ouverte notamment sur la documentation des données avec une section dédiée aux métadonnées et aux entrepôts de données. De son côté, Science Europe vient aussi de partager son propre guide. Le document propose ainsi un tableau de critères pour pouvoir évaluer la qualité de rédaction du PGD ainsi qu’une documentation des différentes questions à se poser lors de sa mise en place.

Mieux se repérer dans le paysage éditorial scientifique : bien choisir sa revue en open access et éviter les erreurs. Construit en 11 points, le document élaboré par le consortium Couperin, revient sur les différents modèles de publication existants et propose plusieurs outils aux chercheurs pour les guider dans leur choix de revue, ou repérer les revues fiables en accès ouvert ne demandant pas de frais de publication aux auteurs.

La valorisation du logiciel libre dans la stratégie publique pour le numérique. La tribune parue dans Le Monde milieu janvier mentionne la création prochaine d’une « mission logiciel libre » placée dans le giron du premier ministre. A l’horizon de la présidence tournante de l’Union européenne endossée par la France en 2022, cette cellule aura pour objectif de travailler avec des acteurs du libre afin de tendre progressivement vers un bon niveau d’autonomie numérique national favorisant l’innovation. La démarche du logiciel libre est naturellement accompagnée et renforcée par la politique d’ouverture des données.

Recommandations de l’OCDE sur l’accès à la recherche financée sur fonds publics. Adoptées en 2006, les recommandations de l’OCDE sur l’ouverture des données de recherche ont été amendées et publiées le 21 janvier après deux années de travaux et en prenant en compte la nouvelle donne du Covid-19. Le rapport encourage notamment « le développement de l’investissement privé dans les infrastructures de données de recherche et les compétences nécessaires à leur gestion et utilisation. » Par ailleurs, le texte couvre désormais l’enjeu de l’accès aux métadonnées et au code source des logiciels. Plus d’informations ici. 

Avant-projet de recommandation de l’UNESCO sur la science ouverte. Par le biais du Comité pour la Science Ouverte, la France commente les points saillants de l’avant-projet de recommandation élaboré par l’UNESCO sur la science ouverte. “Le paiement de frais de publication ne doit absolument pas être le modèle dominant”, alerte le texte, mettant en avant des modèles de publication alternatifs déjà en place en Allemagne, en Grande-Bretagne ou en France avec OpenEdition. Il est également souhaité que  la notion de reproductibilité figure noir sur blanc dans l’avant-projet comme objectif, valeur et principe directeur de la science ouverte.

Le site français de Horizon Europe est en ligne. Ce site gouvernemental permet aux chercheurs de connaître les conditions pour candidater à un financement européen et pour participer au nouveau programme cadre. Il indique notamment que, pour améliorer les capacités de réussite des laboratoires à Horizon Europe, l’ANR ouvre un appel “dédié au montage de réseaux scientifiques européens et internationaux”.

Focus sur le plan quantique. Publié le 21 janvier par Emmanuel Macron au Centre de nanosciences et de nanotechnologies de Paris Saclay, le plan quantique prévoit un investissement d’1,8 milliard d’euros pour développer la recherche dans le domaine quantique (ordinateurs, capteurs et communications quantiques notamment) ainsi que l’industrie et la formation. La mise en œuvre s’appuie sur le CNRS (avec notamment l’Institut de Physique), le CEA et l’Inria. Ce plan fait suite au rapport rendu par la députée Paula Forteza, le chercheur Iordanis Kerenidis (CNRS) et l’ancien PDG de Safran, Jean-Paul Herteman, en janvier 2020.

Les 50 ans de l’IN2P3. L’institut national de physique nucléaire et de physique des particules fête ses 50 ans. Seize journées sont programmées dans différentes universités durant toute l’année 2021. C’est le 14 avril, jour anniversaire du décret créant l’Institut, que débuteront les festivités au musée Curie. Un site web retrace l’histoire de l’institut et son implication dans des découvertes scientifiques comme le boson de Higgs ou les premières ondes gravitationnelles.

CERN : retour sur l’année 2020. Le CERN fait sa rétrospective de l’année 2020 : nouvel accélérateur linéaire, recherche sur le Covid, ou encore nouveau type de tetraquark sont au programme.

A savoir…

Qu’est-ce que le travail scientifique des données ? La traduction française de l’ouvrage paru chez MIT Press en 2015 Big Data, Little Data, No Data. Scholarship in the Networked World, est désormais disponible sur Openedition. Cet ouvrage présente plusieurs études de cas dont deux en sciences exactes (astronomie et science technologie des réseaux de capteurs) avant de conclure sur les politiques et pratiques en matière de données (partage, réutilisation, reconnaissance et conservation des données).

Mieux organiser ses fichiers. Afin de faciliter la gestion de projet et la collaboration en matière de recherche, des chercheurs allemands proposent un modèle d’arborescence de dossiers disponible ici. Cette proposition s’inscrit dans la continuité d’un travail d’enquête mené auprès de 3 laboratoires de neurosciences en Allemagne et dont les résultats sont disponibles ici. Retrouvez également la ressource en ligne de Datacc sur le nommage et l’organisation des fichiers. 

A noter

Tout ce que vous n’avez jamais osé demander sur les cahiers de laboratoire électroniques. Que vous soyez novice ou déjà utilisateur des cahiers électroniques, l’équipe du projet Datacc vous donne rendez-vous mercredi 3 février pour un webinaire qui se déroulera en deux temps. Au programme : introduction sur l’état actuel de la réflexion sur les cahiers de laboratoire électroniques (ELN) à l’échelle nationale, suivi d’un retour d’expérience et démonstration de Sylvain Monnier, chercheur en biophysique à l’Institut Lumière Matière (UMR 5306 Lyon 1/CNRS), sur l’utilisation d’elabFTW au sein de son équipe. Inscription ici.

Commentaires(2)

julien colomb Le 30 janvier 2021 à 10 h 02 min

bonjour,
juste une précision a propos du travail de l’équipe GIN-Tonic. L’étude s’est fait sur trois consortiums de neuroscience, donc à peu près 60 laboratoires.
Ce serait bien de lier avec le doi, plutôt que l’url de l’article: Colomb, Julien, Thorsten Arendt, Keisuke Sehara, and The Gin-Tonic team. “Towards a Standardized Research Folder Structure.” Generation Research, 2021. https://doi.org/10.25815/WCY6-M233.

Merci pour l’intérêt porté à notre travail!

    Alice Labeye Le 11 février 2021 à 11 h 15 min

    Bonjour,
    Merci pour la précision !
    La modification a été faite pour le DOI.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *