Actualités - Actu en bref

Bulletin de veille – Novembre 2023

L’actualité dans vos domaines

Utilisation du ChatGPT dans la littérature scientifique. Dans l’un de ses articles, Rebecca Trager, correspondante américaine de Chemistry World, met l’accent sur le travail fait par un groupe de chercheurs de l’université du Kansas, où l’intelligence artificielle a été utilisée pour détecter les articles sur la chimie générés par de grands modèles linguistiques comme ChatGPT. Leur détecteur a été entraîné sur 100 passages introductifs provenant de 10 revues publiées par l’American Chemical Society. Ils ont constaté que le détecteur reconnaissait le texte scientifique généré par ChatGPT avec une précision de plus de 99 %. La correspondante américaine a recueilli les avis, négatifs et positifs, de certains chercheurs sur l’utilisation, appropriée ou inappropriée, de ces types de détecteurs basés sur l’intelligence artificielle.

Chat-GPT un outil de fouille de texte performant en chimie ? Des outils dédiés ont été développés pour permettre la fouille de texte en chimie (ChemDataExtractor, ChemRxnExtractor). Les Large Language Models (ChatGPT, Llama2, T5 ou BART) pourraient-ils les remplacer ? Une équipe de chercheurs chinois étudie dans ce preprint les performances de ChatGPT pour la réalisation de 5 tâches : reconnaissance de substances, identification de leur rôle dans la réaction, extraction des informations de synthèse (RMO), extraction de données de RMN, conversion de paragraphes décrivant des réactions en séquences d’action. Chat-GPT s’avère particulièrement performant d’après ces tests, notamment dans des contextes flous (« fuzzy rules » or « hard to define extraction »).

SURF : A simple user friendly reaction format. RDfile, CDXML, RInChi, RXNFiles, CMLreact, JSON : les formats de données utilisés pour stocker les structures moléculaires et les diagrammes réactionnels sont nombreux, mais ils n’utilisent pas de vocabulaire contrôlé et ne permettent pas la description détaillée des réactions. Si UDM (Unified Data Model) et le schéma ORD (Open Reaction database) présentent des avancées notables pour le partage des données et leur utilisation par des machines, ils restent, selon les auteurs de ce preprint, difficiles à implémenter dans les domaines académiques ou industriels car trop complexes et mono-disciplinaires. Développé par les laboratoires Roche, le format SURF est conçu pour être lisible par des humains et par des machines. La recherche et le filtrage d’information sont simplifiés par la structure tabulaire qu’il utilise. Des informations détaillées sur le format sont disponibles sur GitHub, des scripts Python permettent la conversion entre formats (ORD, SMILES, UDM) facilitant ainsi l’interopérabilité.

Quelles évolutions du facteur d’impact en science des matériaux ? Une équipe de l’Université de Séville analyse dans cet article l’évolution du facteur d’impact des revues en science des matériaux identifiées d’après la catégorie “Materials Science” du Journal Citation Report. A partir de 5 titres publiés chez Elsevier, ils détaillent l’impact du nombre moyen de références, du nombre d’articles publiés par an sur l’évolution du facteur d’impact. Acta Materialia et Scripta Materialia, par exemple, ont vu leur facteur d’impact croître plus fortement relativement à d’autres titres, sous l’effet combiné d’une stabilité du nombre d’articles publiés par an dans ces revues et d’une croissance du nombre d’articles et de références dans l’ensemble de la catégorie. Ils soulignent également l’importance des bases de données bibliographiques et de l’open access : ils ont contribué à faciliter et accélérer l’accès aux résultats de la recherche.

Les ressources de l’IUPAC. L’International Union of Pure and Applied Chemistry propose une nouvelle entrée sur son site web destinée à rassembler les projets et contenus relatifs à l’enseignement de la chimie et de la science des matériaux. Les guides de nomenclature (Organic Nomenclature, Inorganic Nomenclature et Polymer nomenclature sont également accessibles sous cette rubrique.

Lancement de Easy Data. Le centre de référence thématique DataTerra a inauguré le 6 novembre un nouvel entrepôt, Easy Data (Earth System Data Repository), permettant de déposer et diffuser les données de longue traîne en sciences de l’environnement. L’utilisation de standards et de métadonnées riches, le respect des principes FAIR garantiront la réutilisabilité des données pour les communautés du Système Terre et de l’Environnement. Le replay du lancement est disponible.

Une nouvelle revue chez IOP Publishing. IOP Publishing (IOPP) lance Sustainability Science and Technology, une revue interdisciplinaire en libre accès consacrée à la durabilité dans les domaines de l’ingénierie, de la chimie, de la physique, de la science des matériaux et de l’environnement. Il est possible de soumettre ses articles pour janvier 2024.

Science ouverte

Une évaluation de la recherche dissonante pour les chercheurs ?  Sur la base d’une enquête réalisée auprès de 198 répondants, des chercheurs de l’Open and Reproducible Research Group de l’Université Technologique de Graz étudient dans cet article les dissonances perçues entre les critères que les chercheurs eux-mêmes considèrent comme importants pour l’évaluation de la qualité de leurs travaux et ceux retenus, selon eux, par leur institution. Le mentorat (encadrement du travail des doctorants et post doctorants) et la collégialité apparaissent parmi les critères les plus importants pour les chercheurs, alors que la capacité à obtenir des financements, à gérer des projets et à publier de nombreux articles dans des revues reconnues constituent des critères de premier plan pour leurs institutions dans l’évolution de leur carrière. Le partage du code et des données est classé en dernière position : les chercheurs n’estiment pas que leur institution le valorise lorsqu’il s’agit de leur attribuer une promotion.

Le projet CoARA Boost. La Coalition pour l’avancement de l’évaluation de la recherche (CoARA) a lancé en novembre et pour 3 ans le projet COARA boost pour accélérer la capacité opérationnelle de la coalition. Doté de 5 millions d’euros par l’Union européenne, le projet permettra notamment de créer des communautés de pratiques, d’établir un observatoire des pratiques responsables d’évaluation de la recherche, de financer 50 projets pour mettre en oeuvre les principes de CoARA et d’encourager la coopération internationale.

La politique d’open access s’ouvre au livre au Royaume-Uni. UK Research and Innovation (UKRI) lance un fonds de 3,5 millions de livres pour financer la publication en open access d’ouvrages ou de chapitres d’ouvrages. Les Book Processing Charges (BPC) pourront être financés à hauteur de 10000 livres, la contribution pourra s’élever à 6000 livres pour un titre publié dans le cadre du modèle diamant (sans BPC) et à 1000 livres pour un chapitre. Les demandes pourront être déposées à partir de fin novembre pour un financement débutant en janvier 2024.

STM, DataCite et Crossref : mise à jour de la déclaration commune sur les données de la recherche. STM, DataCite et Crossref annoncent la mise à jour de leur déclaration commune sur les données de recherche. Il est ainsi attendu que, dans le respect des principes FAIR, les chercheurs déposent les données de recherche et les résultats connexes dans un entrepôt fiable, attribuant un doi et proposant des métadonnées complètes. Les éditeurs doivent établir des politiques de données appropriées pour leurs revues. Il est également prévu de faire un lien entre publications et jeux de données, via les doi et de proposer des outils facilitant le partage des données pour les chercheurs.

La Coalition S veut aller plus loin. La coalition des financeurs européens, dans sa proposition “Towardsresponsible publishing: a proposal from cOAlition S” met en exergue plusieurs principes pour remettre les chercheurs au cœur du processus de publication : ils sont seuls responsables de la diffusion de leurs résultats et non les éditeurs ou d’autres tiers. Si la coalition rappelle que ces résultats doivent être immédiatement disponibles en libre accès, elle insiste sur le processus de qualité, communautaire et ouvert, pour garantir la fiabilité et la reproductibilité. Toutes les productions scientifiques peuvent être prises en compte dans l’évaluation de la recherche. L’ensemble des acteurs doivent s’engager à soutenir la diversité de l’écosystème de publication sous la direction des universitaires et sa durabilité. Un article de Nature, qui reprend les évolutions et les actions de la Coalition S, commente la proposition soumise à consultation. Si les responsables du blog Scholarly Kitchen relèvent dans un billet  l’impact positif de la Coalition S dans l’édition scientifique, ils alertent sur le risque de fragmentation des travaux de recherche au détriment de la cohérence générale des projets de recherche. Il est donc nécessaire d’envisager les conséquences non voulues des principes édictés par la coalition pour éviter les dérives concernant les APC. Ils appellent donc à ce que le Plan S soit réellement dirigé par les chercheurs mais en prenant garde à ne pas alourdir les charges et responsabilités des auteurs. La consultation ouverte par la Coalition S auprès des communautés scientifiques entre novembre 2023 et avril 2024 permettra sans doute de tirer des enseignements sur les attentes des chercheurs autour de la mise en œuvre de ces principes et sur l’évolution des publications scientifiques.

Résultats du 3e appel à projet du Fonds National Science Ouverte. Le Fonds National Science Ouverte vient de publier les résultats du 3e appel à projet en faveur de la publication scientifique ouverte. Parmi les 19 lauréats retenus, le projet NEpHAL+, porté par le CCSD et SoftWare Heritage, a pour objectif de développer l’examen par les pairs des pré-publications, des jeux de données et des logiciels de la recherche et de proposer des rapports de relecture ouverts. Du côté de la Physique-Astronomie-Astrophysique, deux projets ont été retenus : grâce au projet CDS-ODAS, le Centre des Données Astronomiques de Strasbourg vise à associer articles et données (images, spectres, cubes series) via le service de référence VizieR ; le projet SciPost-El Dia, quant à lui, permettra à l’infrastructure d’édition SciPost de consolider et diversifier ses services et le processus de publication diamant.

Intégrité scientifique

« Ma revue a été piratée ». Retraction Watch donne la parole à l’éditeur de la revue Scandinavian Journal of Information Systems (SJIS) qui a fait l’objet d’un détournement frauduleux. Des cybercriminels ayant contrefait le site de la revue ont envoyé des lettres d’acceptation à des auteurs, leur réclamant des frais de publication pour la publication de l’article soumis. Scopus semble avoir contribué à cette confusion : la notice de la revue dans la base de données renvoyait vers le site contrefait. Plus de 2 mois ont été nécessaires à Scopus pour corriger cette erreur qui a contribué à diriger de nombreux auteurs vers ce site. L’éditeur décrit le procédé employé en détail dans un article. Le site Hijacked Journal Checker recense les pratiques de ce type qui ont pu être identifiées.

Le DOAJ intègre les numéros spéciaux à ses critères de sélection. Face à l’inflation des numéros spéciaux et au développement de pratiques douteuses pouvant y être associées (accroissement du nombre d’articles publiés, peer review allégé, marketing agressif, etc.) le DOAJ propose une série de critères pour identifier plus facilement les pratiques légitimes associées à la production de numéros spéciaux. Les thématiques sont-elles en lien avec la ligne éditoriale de la revue ? La volumétrie est-elle proportionnée ? Le niveau d’exigence est-il comparable à celui requis pour les autres articles ? Les éditeurs invités sont-ils qualifiés ? L’éditeur en chef garde-t-il le contrôle sur l’ensemble des contenus ? Le processus de revue par les pairs est-il indépendant ?

Plus de 200 articles rétractés. Tous publiés dans une revue d’ingénierie publiée chez Sage (International Journal of Electrical Engineering & Education), ces articles ont été rétractés pour des motifs tels qu’une revue par les pairs douteuse, des auteurs usurpant des signatures, d’autres injoignables, d’autres encore reconnaissant n’avoir pas écrit l’article en question ou déclarant ne pas connaître leur co-auteur. En réponse, Sage revient sur les méthodes utilisées pour identifier ces pratiques et les difficultés rencontrées par ses équipes pour repérer les contenus frauduleux.

Guides et ressources

Maggot : un écosystème pour le partage des métadonnées. Développé par l’INRAE, Maggot (Metadata AGGregation On data sTorage) est une application web spécialement conçue pour annoter des jeux de données produits au sein d’un collectif de personnes (unité de recherche, plateforme, projet multi-partenaire, etc.) et avec une gestion locale directement dans l’espace de stockage des données. Voir le poster pour un bref aperçu.

Vous voulez ouvrir et partager vos données ? Le Collège des Données de la recherche du Comité pour la science ouverte vient de publier une méthodologie pour vous aider à choisir un entrepôt thématique de confiance.

Éviter les prédateurs. Le CoopIST met en ligne trois fiches de conseils pour identifier et éviter les revues, les éditeurs et les conférences prédatrices. La première rappelle que la diffusion du modèle de publication doré (avec frais de publication ou APC) favorise le développement des revues prédatrices. La seconde propose trois outils : Think Check Submit, Compass to Publish et une grille d’évaluation établie par l’Université du Québec, pour caractériser le caractère prédateur d’une revue ou d’un congrès.

Data Monitor décrypté. Le GTSO données de Couperin vient de publier une note de décryptage sur Data Monitor, outil développé par Elsevier pour « identifier et moissonner de façon automatique les métadonnées de jeux de données ». Elle présente un retour d’usage de la part d’une université utilisatrice (Université de Milano Bicocca), une description du fonctionnement de l’outil, une évaluation et un avis quant à l’opportunité pour un établissement de souscrire à ce type de solution

La bande dessinée sur les données de la recherche. Intitulée « On fait le point sur les données de la recherche avec Sorella », la bande dessinée a été produite par le Service commun de la Documentation de l’Université de Guyane et elle s’adresse à un public de doctorants et de chercheurs dans un objectif d’accompagnement à ces nouvelles pratiques scientifiques. Le projet a été co-financé par l’URFIST de Paris (Ecole nationale des Chartes – PSL) et la bande est le deuxième tome d’une série débutée avec la bande dessinée didactique On fait le point sur la bibliométrie avec Manuella.

Commentaires

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *