Actualités - Actu en bref

Bulletin de veille – Novembre 2022

L’actualité dans vos domaines

Le cahier de laboratoire Chemotion pour partager ses données. Une équipe de recherche en chimie propose dans cet article un guide de bonnes pratiques pour travailler en collaboration. À la fois cahier et entrepôt de données, il permet de gérer les données de recherche, notamment les résultats négatifs, tout en respectant les principes FAIR (facile à trouver, accessible, interopérable, réutilisable). Chaque membre de l’équipe peut avoir des droits d’accès différents selon son niveau de responsabilité dans le projet. Ce guide propose une typologie de ces droits ainsi que la manière de les paramétrer dans Chemotion.

Des données et des logiciels ouverts : les clés de la transformation numérique en chimie. À l’exception de certains domaines  – tels la cristallographie – la chimie connaît un manque de culture du partage des données. Les données manquent pour déployer les potentialités de l’intelligence artificielle. Les applications sont pourtant nombreuses et concernent tous les domaines de la chimie : chimie de synthèse avec le lancement de l’Open Reaction Database, TDM appliqué à la littérature scientifique, reconnaissance optique de structures (OCSR),  pharmacologie et conception de nouveaux médicaments. Des données (standardisées et qui ont fait l’objet de curation), des publications et des logiciels ouverts seront les moteurs de cette transformation, d’après les travaux d’une équipe de chercheurs allemands.

La gestion des données de recherche en chimie. Une gestion efficace des données dès le début d’un projet de recherche facilite leur diffusion et leur réutilisation. Afin de répondre à ces objectifs, l’usage des cahiers de laboratoire et des systèmes de gestion d’information de laboratoire se développent mais ne sont pas encore généralisés. Une culture de la gestion des données de recherche est encore à développer chez les jeunes chimistes afin que ces principes soient intégrés dans les processus de travail. Ces nouvelles méthodes doivent aussi s’accompagner de changements techniques tels que la définition des normes et des standards de métadonnées. Ces derniers permettent de renforcer les possibilités d’échange, d’interopérabilité et de conservation des données. Cet article du Angewandte Chemie International Edition recense les méthodologies et les techniques à faire évoluer et souligne notamment l’engagement du Consortium allemand NFDI4Chem et de l’International Union of Pure and Applied Chemistry (IUPAC) dans ce domaine.

De l’importance des métadonnées. Les métadonnées sont le nerf de la guerre dans le partage et l’ouverture des données, comme le rappelle François Sabot (IRD) dans un article publié dans BMC Genomic data. Elles sont essentielles pour comprendre d’éventuels biais ou des limites dans l’analyse des données. L’auteur propose une typologie de métadonnées distinguant les métadonnées d’échantillonnage, d’acquisition et de traitement des données. Embarquer les informations sur les instruments de mesure utilisés, leur paramétrage, les  logiciels intermédiaires employés, leur version et les paramètres complexes utilisés : autant d’informations non neutres et essentielles à la compréhension et à la réutilisation des données.

Les principes FAIR dans la physique des photons et des neutrons. Dans une brochure finale, PaNOSC donne un aperçu de ses réalisations à l’achèvement de la subvention H2020, pour produire des données FAIR dans les installations de photons et de neutrons (PaN) en Europe. En particulier, elle met en évidence ses résultats dans les domaines de la gestion des données, depuis la collecte des données jusqu’à la publication, en présentant les principaux logiciels et services développés dans le projet pour le référencement des données, la recherche de données, l’analyse de données, la simulation et l’apprentissage en ligne.

Comment financer les logiciels de recherche ? La réflexion est lancée. Les 8 et 9 novembre, la Research Software Alliance (ReSA) et le Netherlands eScience Center  ont organisé un International Funders Workshop: The Future of Research Software. Au cours de cet atelier, les participants ont exploré comment financer efficacement les logiciels de recherche nouveaux et existants. Au total, plus de 60 représentants de 45 organisations ont participé à la réflexion. A l’issue, une ébauche de déclaration, avec des principes et des recommandations, a été élaboré : l’Amsterdam Declaration on Funding Research Software Sustainability. Certaines présentations de l’atelier sont accessibles ici

Intégrité Scientifique et évaluation

Avoir une mauvaise conduite n’est pas une bonne idée. Adopter un mauvais comportement dans le domaine de la recherche scientifique, ainsi que violer les principes fondamentaux de l’intégrité scientifique, ne conduit pas toujours à des avantages. Cette année, CLARIVATE (Web of Science) en dressant la liste Clarivate’s Highly Cited Researcher a pris en compte les mauvais comportements, tels que le plagiat, la fabrication de données ou de résultats, la manipulation de données ou d’images, la fausse déclaration de résultats et l’autocitation extrême. Avec la mise en œuvre de ces filtres, cette année le nombre de candidats potentiels au titre de « Highly Cited Researcher » exclus de la liste finale est passé de quelque 300 en 2021 à environ 550 en 2022. Ici pour plus de détails.

500 articles retirés de la revue Materials Today: Proceedings. L’observatoire Retractation Watch révèle le retrait massif de communications publiées dans la revue Materials Today: Proceedings d’Elsevier. Non seulement le système de Peer Review semble ne pas avoir répondu “aux standards de la revue”, comme le précise l’éditeur, pour justifier ces retraits, mais la tenue même des conférences dont les actes sont publiés est questionnée. Le recours à des paper mills est également soupçonné.

La Coalition for Advancing Research Assessment gagne de nouveaux membres ! L’Agrément on Reforming Research Assessment mis en oeuvre par la Coalition for Advancing Research Assessment (CoARA) recueille de nouvelles signatures :

Pour rappel, cet accord, basé sur 10 engagements, définit une orientation commune pour les changements dans les pratiques d’évaluation de la recherche, des chercheurs et des organismes de recherche, avec pour objectif primordial de maximiser la qualité et l’impact de la recherche.

Édition scientifique

Les ouvrages en libre accès du MIT. Soutenus par plus de 265 bibliothèques dans le monde, les livres du “MIT Press Direct to Open books” disponibles en libre accès ont été consultés plus de 176 000 fois en dix mois. Cette plateforme, Direct to Open (D2O), ouverte en 2021, propose une cinquantaine d’ouvrages. Parmi les plus consultés : Memories of a Theoretical Physicist: A Journey across the Landscape of Strings Black Holes and the Multiverse de Joseph Polchinski.

La revue d’Écologie disponible sur Persée. Ce journal trimestriel, publié entre 1931 et 2018 par la Société Nationale de Protection de la Nature et d’Acclimatation de France, est désormais disponible sur Persée en texte intégral ici

Institutions

HAL : une nouvelle interface pour déposer. Le CCSD travaillait depuis plusieurs mois sur une nouvelle interface pour déposer de manière plus rapide et plus intuitive : depuis le 15 novembre, il est possible de l’utiliser (en choisissant “nouvelle interface”). Pour faciliter son appropriation par les chercheurs, plusieurs ressources (une vidéo “Déposer en moins de 5 minutes » et un guide « Réussir mon dépôt ») ont été élaborées ainsi qu’un nouveau parcours de formation : “Formez-vous au dépôt dans HAL”. Les deux interfaces seront disponibles en parallèle jusqu’en février.

Un cristal collectif pour Click & Read. L’extension Click and Read, élaborée par l’INIST, a été récompensée par un Cristal collectif du CNRS. L’occasion de rappeler que cette extension permet d’accéder facilement et directement aux ressources disponibles en texte intégral en libre accès (via Unpaywall), via les abonnements de certaines universités ou des achats pérennes (via Istex). Click and read compte déjà 17 000 installations.

Ouverture de données à l’université de Genève. En 2017, le Fonds national suisse de la recherche scientifique (FNS) a rendu obligatoire, lors de chaque demande de financement, un plan de gestion spécifiant de quelle manière les données seront conservées, documentées et partagées. Cette obligation a conduit les universités suisses à mettre en place des infrastructures informatiques pour assurer l’accessibilité et la pérennité des données. Comme par exemple l’Université de Genève, laquelle s’est équipée du centre de données Yareta (où les données sont stockées), couplé à un équipement de calcul à haute performance. À ce jour, dix térabytes des données de recherche sont déposés en accès libre sur Yareta. Plus de détails sur cet article.

Un nouvel appel à projets sur l’édition scientifique ouverte. La troisième édition de l’Appel à projets sur la publication et l’édition scientifiques ouvertes lancée par le Fonds national pour la science ouverte est ouverte jusqu’au 22 février 2023. Elle a pour but d’encourager “la conversion de contenus éditoriaux vers une diffusion numérique en accès ouvert”. On peut relever les objectifs de “favoriser le continuum entre publications, données et codes, de favoriser la reproductibilité ou la traçabilité de la démarche scientifique, l’intégrité scientifique, lutter contre le biais de publication en favorisant la publication des résultats négatifs, soutenir les processus éditoriaux innovants, par exemple en matière d’évaluation par les pairs, d’écriture collaborative”. Dans la foulée, le Fonds National Science ouverte publie son premier rapport d’activité qui se conclut par les engagements pour 2023, parmi lesquels : la poursuite du soutien au dispositif Recherche Data Gouv, à arXiv, Redalyc-Amelica, DOAJ, à Software Heritage et RDA et la création d’une alliance des éditeurs scientifiques publics.

Le Parlement européen a trouvé un accord pour le fonds de recherche 2023. Après des négociations entre les membres du Parlement et le Conseil européen, le parlement a approuvé un budget de 1,05 milliard d’euros de fonds supplémentaires, en plus des 185,6 milliards d’euros proposés par la Commission, destinés à la recherche. Une partie des fonds supplémentaires ont été accordés à Horizon Europe (un montant de 12,4 milliards d’euros a été convenu pour 2023), au financement de l’environnement et du climat et aux infrastructures énergétiques.

Allemagne : de nouvelles infrastructures de gestion de données obtiennent un financement. Un financement fédéral vient d’être accordé dans le cadre de la German National Research Data Infrastructure (NFDI) à 8 nouveaux consortiums : un consortium transversal destiné à fournir des services de stockage, de calcul, des workflows, des services de support et des consortiums thématiques, parmi lesquels :

  • FAIRagro : FAIR Data Infrastructure for Agrosystems
  • NFDI4BIOIMAGE : National research data infrastructure for microscopy and bioimage analysis
  • NFDI4Energy : National Research Data Infrastructure for Interdisciplinary Energy System Research

Études et enquêtes

Les réseaux sociaux peuvent soutenir les publications en accès libre. Partager un article scientifique sur les réseaux sociaux augmente la visibilité de son propre travail de recherche et parfois aussi le nombre de citations de l’article. C’est pour cette raison que souvent les chercheurs mettent leurs propres articles en accès libre sur les réseaux sociaux. Un cas dans le domaine de l’ophtalmologie est rapporté dans la revue Cureus. Les articles ayant fait l’objet d’un tweet au moins une fois ont obtenu un score Google Scholar significativement plus élevé (1,7 fois plus) que les articles n’ayant pas fait l’objet d’un tweet. De même, le score Scopus moyen est significativement plus élevé pour les articles tweetés par rapport aux articles non tweetés (1,6 fois plus).

Participez à l’enquête sur les identifiants numériques des chercheurs ! Cette enquête, proposée par le réseau des URFIST (Unités Régionales de Formation à l’Information Scientifique et Technique), a pour objectif “de mieux comprendre l’usage des identifiants numériques chercheurs : contexte, connaissance et pratiques, moteurs et freins à leur adoption, besoins éventuels d’accompagnement”. Elle s’intéresse notamment à l’identifiant ORCID “mis en avant dans la politique des données, des algorithmes et des codes sources”. L’enquête, qui prend entre 10 à 20mn est accessible ici jusqu’au 3 février.

Délai de publication. Plusieurs enquêtes réalisées par les éditeurs Springer Nature, Editage et Taylor & Francis ont montré que le délai de publication est un critère important aux yeux des auteurs pour choisir dans quelle revue publier.  Cet article étudie les délais de publication chez dix des plus grands éditeurs (Elsevier, Springer Nature, Wiley, MDPI, Taylor & Francis, Frontiers, ACS, Sage, OUP, Wolters Kluwer) portant sur la dernière décennie. Le délai de publication s’est accéléré, notamment grâce à la diffusion électronique. La durée de l’évaluation par les pairs varie selon les disciplines. L’éditeur MDPI est le plus rapide mais il est controversé car sa performance semble acquise au détriment de la qualité de son processus d’évaluation. ACS, en revanche, montre qu’il est possible d’avoir des exigences éditoriales élevées tout en étant le deuxième éditeur le plus rapide. L’auteur s’interroge enfin sur ce que serait une « bonne » vitesse de publication. Selon lui, la mise en place d’une plateforme qui fournirait cette information permettrait aux auteurs de choisir en connaissance de cause.

Open Data : 4 jeux de données sur les brevets disponibles. Le portail Open Data, qui  propose 160 jeux de données open data sur l’enseignement supérieur et la recherche, vient de publier 4 nouveaux concernant les brevets et accessibles ici. Issus de la base de données PATSTAT de l’Office européen des brevets, ils présentent les technologies, les familles, les déposants et les demandes de brevets déposés depuis 2010 où au moins une des personnes (déposant ou inventeur) est localisée en France.

La science ouverte et son modèle économique. Dans un document déposé sur l’archive Hal, une synthèse de l’atelier organisé par le groupe de travail DIALOGU’IST du réseau RENATIS et consacré à « la Science ouverte : du modèle économique à l’évaluation des résultats », est présentée. Quelques points importants à signaler : état de l’art des modèles émergents de publication ; différents retours d’expérience de mise en œuvre de nouvelles politiques éditoriales telles le modèle Diamant ou le peer-reviewing ouvert ; les modèles contractuels et les choix retenus par les acteurs de l’édition.

Pérennité des données associées aux publications. Dans une étude publiée sur PLOS ONE, la chercheuse Lisa M. Federer, du National Library of Medicine, a essayé de comprendre combien de temps les données, les codes et les autres objets numériques signalés dans les déclarations de disponibilité des données (Data Availability Statement, DAS) sont accessibles. 4 917 URL et 3 586 DOI uniques, extraits d’articles publiés dans PLOS ONE entre 2014 et 2016, ont été utilisés pour tenter de retrouver, en juin 2021, les ressources référencées. 80% des ressources associées à une URL ou un DOI restent disponibles et accessibles ; les ressources comportant un DOI ont significativement plus de chances de rester disponibles et accessibles que celles comportant une URL; 84,3 % des ressources partagées dans un entrepôt restent disponibles, contre 72 % des ressources partagées par une autre méthode.

Guides et outils

Une nouvelle liste de datajournals. Une nouvelle liste de datajournals est disponible sur Zenodo. Issue de la compilation de différentes sources existantes, elle présente 135 titres de datajournals. Cette liste est mise à jour sur Github.

Rédiger et publier un data paper. L’URFIST de Lyon vient de publier un support d’aide à la rédaction de data paper. Ce type d’article scientifique est évalué par les pairs et citable. Il a pour objectif de décrire un jeu de données, la méthode ayant permis de l’obtenir et son potentiel de réutilisation.

Formats de fichiers : que recommandent les institutions ? Les formats de fichiers préconisés pour l’archivage et la conservation des données par de nombreuses institutions de référence sont recensés dans un inventaire, une initiative lancée par les archives nationales d’Estonie et du Danemark. Un appel est lancé aux institutions pour partager leurs propres recommandations.

Commentaires

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *