Actualités - Actu en bref

Bulletin de veille – Mars 2024

L’actualité dans vos domaines

Quels usages des entrepôts de données en sciences des matériaux ? Cet article, publié dans Communications chemistry, analyse les usages disciplinaires des entrepôts de données. Les auteurs ont parsé un corpus d’articles issus de la base Dimensions pour en extraire les URL cités et identifier les DOI d’entrepôts et les liens vers GitHub. Ils mettent en évidence une accélération des références faites aux entrepôts ces dernières années, un usage important de GitHub ainsi que des spécificités disciplinaires fortes (telle, l’utilisation prédominante de Nomad et Materials Cloud en chimie).

Zooniverse, lauréat du concours Science ouverte de la Maison Blanche. Zooniverse est la plus grande plateforme de données ouvertes pour la recherche participative, permettant à des volontaires du monde entier de contribuer à la collecte et à l’analyse de données sur de nombreux sujets (marquage d’animaux, découverte de planètes, etc.). Elle compte plus de 2,6 millions d’utilisateurs sur 90 projets actifs.

Le big data et les enjeux de la science ouverte en sciences de la terre. La modélisation des environnements (océans, atmosphère, eaux de surface) fait appel à des volumes de données croissants: données collectées en temps réel, à des échelles spatiales de plus en plus fines, autant de défis en termes de stockage, de traitement et d’ouverture des données. Cet article illustre ces enjeux et présente quelques initiatives destinées à promouvoir la reproductibilité (guideline sur la reproductibilité de la recherche géospatiale, initiatives telles Noaa, Eosids et etc.).

«Dataversifier» les sciences de la terre et de la vie. Cet article s’appuie sur les travaux du projet Letitia, qui vise à construire un lac de données (ensemble de données brutes, non structurées et hétérogènes) pour effectuer la curation et l’exploitation de données expérimentales en sciences de la vie et de la terre. Il examine notamment les méthodes de curation des collections de données, l’apport des dataverses, permettant de générer des DOI, gérer des versions, faciliter les recherches et la réutilisation des données, dans une perspective de science ouverte.

LE CNRS et RENATER au service des données des particules. En France, RENATER et le Centre de Calcul de l’IN2P3 fourniront l’infrastructure nécessaire au CERN pour adapter les capacités de transfert entre les différentes infrastructures de calcul : cela permettra d’absorber l’augmentation considérable des données issues du nouveau collisionneur de hadrons à haute luminosité (HL-LHC). Cliquez ici pour avoir plus de détails.

Science ouverte

Référencer son projet ANR dans HAL à partir du pdf. Dans ce billet, le CCSD annonce que l’extraction automatique des métadonnées depuis le pdf de l’article déposé s’enrichit : il est désormais possible de récupérer les informations codifiées liées à un financement ANR. Cette fonctionnalité qui facilite le dépôt dans HAL sera prochainement élargie aux projets européens. Elle est développée dans le cadre du projet Equipex+HALiance.

Thèses.fr : une nouvelle version ! L’ABES a mis en ligne une nouvelle version du portail des thèses françaises, en cours et soutenues, thèses.fr. Il est désormais possible de consulter les thèses en accès restreint mais non confidentiel, via un accès centralisé national, soumis à authentification. L’ergonomie et l’accessibilité ont été également repensées afin de respecter les normes d’accessibilité (RGAA).

Lancement du «EU Open Research Repository». La Commission européenne et le CERN lancent EU Open Research Repository. Il s’agit d’un projet pilote d’entrepôt pour accueillir les résultats de la recherche (données, logiciels, affiches, présentations, résultats de projets) produits dans le cadre des programmes de financement de la recherche et de l’innovation de l’UE, tels que Horizon Europe et Euratom. Basé sur Zenodo, il permet aux porteurs de projets de respecter facilement les principes FAIR. L’entrepôt, qui comprend déjà 100000 enregistrements, sera pleinement opérationnel à l’automne 2024. A noter : aujourd’hui, plus de 500 projets de recherche financés par l’UE disposent déjà d’une communauté Zenodo.

Baromètre national Science Ouverte 2023. Dans la nouvelle édition du baromètre, on ne constate pas d’augmentation du pourcentage d’ouverture des publications qui reste stable à 65%.  En revanche, quelques évolutions sur les modalités d’ouverture : l’ouverture via des archives ouvertes diminue de 3 points quand l’ouverture via les plateformes éditeur augmente de 3 points. Quant aux données de la recherche, 22% des publications mentionnent le partage de jeu de données, soit un progrès de 2 points par rapport à 2022.

Le coût et le prix de l’accès ouvert aux données de recherche. Dans le contexte de la politique fédérale américaine déclinée dans le Nelson memo de l’OSTP, ce rapport, financé par la NSF, analyse les modèles économiques des entrepôts de données et les coûts associés à la publication des données. La croissance prévisible des dépôts questionne la soutenabilité de ce modèle. Une analyse coût-bénéfice du partage, doit encore, selon les auteurs, être menée.

Notebooks et science ouverte. Sur la base d’une analyse bibliographique fouillée, ce preprint présente une synthèse des études empiriques (cf. la collection du groupe Zotero) menées sur les notebooks (le type Jupyter les plus étudiés, notamment par Émilien Schultz dans cet article). Protéiformes, évolutifs caractérisés par un cadre juridique parfois flou, ils ne sont pas systématiquement gages de reproductibilité, que ce soit par manque de documentation, faible qualité du code, difficultés de suivi des versions ou plasticité des formats. Les auteurs.trices  proposent des pistes pour rendre plus « FAIR » l’utilisation des notebooks.

OSCARS : favoriser l’adoption de la science ouverte en Europe. Financé dans le cadre du programme Horizon Europe et coordonné par le CNRS via le LAPP, le projet a pour objectif de soutenir la création de services de données scientifiques interdisciplinaires et de pratiques de travail durables conformes aux principes FAIR. Via des appels à projets, les chercheurs de tous les domaines scientifiques pourront proposer des services et des projets innovants en science ouverte. Le projet OSCARS entend soutenir le rôle des clusters scientifiques, en les aidant à mettre en place des Centres de Compétence.

Intelligence artificielle

Rapport de la Commission de l’Intelligence artificielle. Missionnée pour établir une feuille de route destinée à renforcer la position de la France en matière d’IA, cette commission a remis ses 25 recommandations. 6 lignes d’actions sont esquissées : renforcer la formation, créer un fonds IA doté de 10Md€, développer l’implantation de centres de calcul, faciliter l’accès aux données de santé notamment et moderniser le mandat de la CNIL, mettre en place une exception IA dans la recherche publique, promouvoir une gouvernance mondiale de l’IA.

Pour un usage responsable de l’IA dans la recherche. La Commission européenne vient de publier des recommandations et une factsheet, à destination des chercheurs, institutions et agences de financement, pour encourager un usage responsable de l’IA dans le domaine de la recherche. Le respect des principes d’intégrité scientifique, la responsabilité des chercheurs sur les produits de leur recherche, et une utilisation tracée et transparente de l’IA générative sont soulignés, ainsi que la nécessaire attention portée à la protection de la propriété intellectuelle et la confidentialité des données, en conservant une perspective critique sur les apports de l’IA. L’utilisation de l’IA dans des activités telles que le peer review ou l’évaluation est à éviter.

Guides et ressources

4 nouvelles ressources :

Commentaires

Laisser un commentaire