Licenses and Data Sharing
- Quelles licences pour quel type de ressources ?
- Définir les usages de son jeu de données
- Les pratiques des financeurs, des éditeurs, des entrepôts
- Ressources
In order to allow other researchers to use your data, whether deposited in a repository or accessible via a publication, it is necessary to establish the terms of use via a licence.
As part of the implementation of the FAIR principles, licensing a dataset helps to ensure compliance with the ‘reusable’ principle by explicitly stating the conditions for reusing the data.
These licences vary in nature and do not all permit the same uses, which is why it is important to understand the practical implications of choosing a particular licence. Most repositories and publishers provide a usage licence for the content they distribute. In fact, granting a licence is often mandatory as part of the process of depositing a dataset.
Which licenses are appropriate for which types of resources?
Research Data
Creative Commons Licenses
Creative Commons (CC) licences are widely used and are the most common choice for research data and scientific publications. The Creative Commons organisation has published and updated them regularly since 2002.
This international non-profit organisation aims to provide legal and technical solutions that promote the sharing of content in the fields of culture, science and education. The organisation is therefore committed to advancing open science. The current version of these licences is version 4.0.
Assigning a licence to a piece of content is a permanent act. Applicable in all countries, Creative Commons licences comply with French copyright law. They enable authors to specify the permissions they grant.
There are six categories of licence, each with terms that are more or less permissive. Pictograms are used to identify these licences and their scope. This diagram (in french) summarises the degree of openness of Creative Commons licences:

To make the Creative Commons licence as clear as possible, it is recommended that you use the relevant logo, specify the licence name and provide a link to it. For example: CC BY 4.0 for a work licensed under CC BY 4.0.
You can use the CC license chooser tool to obtain the HTML code for the selected licence, and you can find the official logos and attribution text here.
Etalab License

In the context of open data, and to facilitate the publication and reuse of public data, Etalab — a department within the direction interministérielle du numérique (DINUM) that coordinates policy on the publication and sharing of public data — has established the ‘Open Licence’.
This open, free and royalty-free licence authorises the reproduction, redistribution, adaptation and commercial use of data, providing the necessary legal certainty for producers and reusers of public data. Attribution of the data’s authorship is required.
The Open License is compatible with open data licences developed abroad, such as the British government’s Open Government Licence, as well as other international standards (ODC-BY, CC-BY, etc.).
Download links:
- Licence Ouverte/Open License Version 2.0 (PDF) : Version française | Version anglaise
- « Licence Ouverte/Open License » logos : Fichier ZIP contenant les logos de la Licence Ouverte sous différentes couleurs
- GitHub : Licence Ouverte/Open Licence au format Markdown
The Public Domain License

The CC0 (Public Domain Dedication) licence enables authors to waive their rights to their work, placing it in the public domain so that others can reuse it without conditions or restrictions (e.g. modification or commercial use).
While it is not mandatory to cite the dataset producer, users are encouraged to do so from a scientific standpoint to identify the source. Therefore, this is the licence that allows for the broadest reuse of datasets.
For more information, read :
Databases
Database protection falls under two different rights: copyright and the “sui generis right of the database producer. Copyright only applies to a database if its structure (model or schema) is considered original; that is, if the arrangement of its elements reflects a choice that ‘bears the imprint of the author’s personality’. This is generally not the case with research databases. The sui generis right protects the investments made by database producers, typically the institution that employs the researcher who creates the database. This right lasts for 15 years after the database is completed. It is therefore recommended that all employers and stakeholders are identified in order to determine each party’s contributions.
The Open Data Commons Open Database License (ODbL) (ODbL) applies to databases. It is a free license that allows for the unrestricted use (including commercial use) of the database. It does not apply to the content (images, text, etc.) within the database, which may be subject to specific licenses (CC BY, CC BY-NC, etc.).
Software and Codes
See page “licences et propriété intellectuelle” LIEN A ACTUALISER
Define the intended uses of your dataset
Au moment de diffuser un jeu de données, il est important de réfléchir aux conditions d’usage, d’accès, d’utilisation de ce jeu, afin de pouvoir lui attribuer une licence appropriée.
Choisir une licence
Plusieurs critères doivent être pris en compte :
- les obligations de diffusion, par exemple pour les données géographiques et environnementales (par exemple la directive INSPIRE)
- les contraintes liées aux jeux de données produits dans le cadre de ZRR ou de PPST, (voir Bassinet, A., Bouchet Moneret, F., Bracco, L., & Jouneau, T. (2023, décembre 6). Les données de la recherche produites en zone à régime restrictif. Atelier de la donnée ADOC Lorraine.
- les exigences ou recommandations des financeurs (voir partie 4.1)
- les exigences des éditeurs, en cas de publication avec un article (supplementary materials),
- les licences proposées par l’entrepôt,
- les licences des contenus repris et réutilisés dans le jeu de données
Il est recommandé d’appliquer une licence largement utilisée de type licence CC.
Il est généralement possible en cas de doute de consulter les services juridiques de son établissement.
Des outils facilitent l’identification de la licence la plus adaptée, via une série de questions/réponses :
- Un outil
sgénéraliste : License selector - Pour les licences Creative Commons : CC license chooser
Pour les codes et logiciels :
- le site choosealicense.com
- le Joinup Licensing Assistant, outil développé par l’UE.
Définir les accès
Au-delà des licences, il est possible de restreindre l’accès à son jeu de données selon différentes modalités.
- Embargo
La plupart des entrepôts permettent de différer l’accès public au jeu de données : il est alors possible de prévoir un délai (période d’embargo) avant la mise à disposition en définissant une date de publication. Ce dispositif peut être utile si on souhaite une publication simultanée du jeu de données et d’un article de recherche. Dans le répertoire des entrepôts en physique et en chimie disponible sur DATACC, la fiche descriptive de chaque entrepôt permet de voir quel type d’embargo est possible (durée, conditions, etc.).
- Accès sur demande
Il est également possible de prévoir un accès uniquement sur demande : en cas de demande de consultation du jeu de données, une requête est alors adressée au déposant via son adresse mail. Ce dispositif peut s’avérer utile en cas de données à fort potentiel stratégique et/ou sensibles.
- Dans le cadre d’une revue par les pairs : url privée / url privée anonyme.
La plupart des éditeurs disciplinaires ou généralistes (IOP, RSC, AIP, Elsevier, Springer, EGU, …) exigent désormais que les auteurs indiquent une déclaration de disponibilité des données (data availability statement) dans leur article. Cette déclaration peut être une condition de publication. La déclaration est souvent demandée dès le processus de soumission de l’article. Les reviewers peuvent enfin réclamer l’accès aux données lorsqu’ils l’estiment nécessaire, lors de l’évaluation du manuscrit. Pour rappel, les datapapers ou datanotes font l’objet d’un reviewing au même titre qu’un article classique.
Dans le cas où les jeux de données doivent être revus en aveugle par des pairs dans le cadre, certains entrepôts rendent possible de créer une URL privée ou une url privée pour un accès anonyme.
A noter : certains entrepôts assurent le reviewing par les pairs des données. C’est le cas par exemple d’ HEPdata.
Les pratiques des financeurs, des éditeurs, des entrepôts
Les financeurs
Les licences CC et la science ouverte
La licence CC BY favorise une large réutilisation des données. Elle est donc cohérente avec les principes de la science ouverte.
A noter : la Directive (EU) 2019/1024 of the European Parliament and of the Council of 20 June 2019 on open data and the re-use of public sector information précise, pour les données de la recherche, en accord avec le principe “aussi ouvert que possible, aussi fermé que nécessaire, que les données issues de la recherche financée par des fonds publics peuvent être réutilisées à des fins commerciales ou non commerciales lorsqu’elles sont déjà rendues publiques via des dépôts institutionnels ou thématiques. C’est donc le cas des données diffusées dans des entrepôts. Les licences CC BY NC ne sont donc pas appropriées.
Compatibilité avec les exigences des financeurs
La coalition des financeurs (cOAlition S) indique, dans le premier article de ses Principes que “les autrices, les auteurs ou leurs institutions conservent les droits d’auteur de leurs publications. Toutes les publications doivent être publiées sous licence ouverte, de préférence sous la licence Attribution (CC BY) de Creative Commons, afin de répondre aux exigences définies par la Déclaration de Berlin “.
Ce principe est précisé dans les orientations sur la mise en oeuvre du Plan S :
La cOAlition S recommande l’utilisation des licences Creative Commons (CC) et exige l’utilisation de la licence Attribution de Creative Commons (CC BY) 4.0 par défaut. Les exceptions suivantes s’appliquent:
- La cOAlition S acceptera, comme solutions de rechange, l’utilisation de la licence CC BY-SA 4.0 et l’utilisation de la licence CC0 (domaine public).
- Les membres de la cOAlition S peuvent approuver l’utilisation de la licence CC BY-ND pour des articles individuels, à condition que cela soit explicitement demandé et justifié par les titulaires de subvention.”
Ces dispositions concernent certes en premier lieu les publications scientifiques mais elles peuvent s’appliquer aux données de la recherche, l’enjeu étant de favoriser la réutilisabilité des données dans les conditions les plus larges possibles.
L’ANR, membre de la Coalition S, s’inscrit donc pleinement dans ces principes dans le cadre de sa politique science ouverte.
Les entrepôts
La plupart des entrepôts, qu’ils soient pluridisciplinaires ou thématiques, proposent des licences d’usage. Il s’agit généralement d’un champ obligatoire à renseigner par les déposants.
Entrepôts généralistes : l’exemple de Recherche Data Gouv
Sur Recherche Data Gouv, la licence attribuée à un jeu de données par défaut est la licence ouverte Etalab 2.0. Il reste possible de modifier cette licence en choisissant des conditions personnalisées : il s’agira de licences Creative Commons. Le déposant peut préciser les fichiers de données auxquels elles s’appliquent.
Il est également possible pour le déposant de restreindre l’accès au jeu de données : voir dans la rubrique “Aide en ligne”, dans le menu “déposant”, la partie intitulée Préciser les conditions d’utilisation du jeu de données.
Les entrepôts de Chimie : quelques exemples …
- Sur Chemotion est proposée la licence CC BY-SA. Un embargo est possible.
- Sur Crystallography Open Database (COD), la licence attribuée est la licence CC0 : “All data in the COD and the database itself are dedicated to the public domain and licensed under the CC0 License. Users of the data should acknowledge the original authors of the structural data ”. Un embargo est possible si les données sont identifiées en tant que « pre-publication deposition ».
- Sur EELS Data Base, la licence attribuée est la licence Open Database License (ODbL). Il n’y a pas de possibilité d’embargo.
- SupraBank propose les licences CC0, CC BY, CC BY-SA. Le déposant peut choisir de déposer ses données en mode « non-publié » (« unpublished »), de façon à en limiter l’accès à lui-même ou à le partager avec un nombre restreint de personnes.
Pour aller plus loin, dans le répertoire des entrepôts en chimie disponible sur DATACC, la fiche descriptive de chaque entrepôt permet de voir quel type de licence est disponible.
Les entrepôts en Physique : quelques exemples
- Data Terra appose une licence Creative Commons et Etalab. CC BY 4.0 par défaut ; un embargo maximum de 2 ans est possible à partir de la date de publication du dépôt.
- HEP data appose une licence CC0 par défaut mais il reste possible d’indiquer une autre licence lors du dépôt si nécessaire.
- NOMAD propose la licence CC BY 4.0. Un embargo est possible pour une durée maximale de 3 ans ; il est également possible de contrôler l’accès aux données via une autorisation préalable de l’auteur pendant 3 ans.
- Sur PANGAEA, les licences possibles sont les licences CC BY, CC BY-SA, CC0. Un embargo est possible : les données sont protégées par mot de passe mais les métadonnées sont rendues publiques sans délai. Il est également possible de donner un accès aux données via un lien privé dont la validité est de durée limitée.
- L’ESRF, dans sa Data Policy, précise que les équipes pourront avoir l’accès exclusif aux données pendant une période d’embargo de trois ans, renouvelable si nécessaire. Après cette période, les données issues de recherches financées par des fonds publics seront publiées sous licence CC BY et accessibles à tous.
- Les données disponibles sur la base de données “Johns Hopkins Turbulence Databases” sous licence Open Data Commons Attribution License (ODC-By): “Johns Hopkins Turbulence Databases are made available under the Open Data Commons Attribution License (ODC-By), which means it is open to use, but requires attribution. “
Pour aller plus loin, dans le répertoire des entrepôts en physique disponible sur DATACC, la fiche descriptive de chaque entrepôt permet de voir quel type de licence est disponible.
Les éditeurs
La plupart des éditeurs recommandent ou exigent que les données en lien avec l’article soient mises à disposition des lecteurs (voir sur DATACC) et précisent aux auteurs la licence à attribuer. Pour rappel, le paiement d’Article Processing Charges (APC) par les auteurs pour une diffusion en libre accès implique que les articles aient une licence CC BY ou équivalent. Dans tous les cas, il est de toute façon recommandé de déposer sa publication dans une archive ouverte de type ArXiv, HAL …
Par exemple, dans son IOP Publishing research data availability policy, IOP Publishing recommande l’utilisation d’une licence ouverte (licence CC0) : “The journal encourages research data to be made available under open licences that permit reuse freely (eg CC0)”.
Pour les Physical Review Journals, les auteurs sont encouragés à attribuer une licence ouverte de type CC0 (voir le paragraphe “data licensing” du Guidelines for Data Availability Statements) : “ Authors are encouraged to make their research data available under open licenses that permit reuse freely, like CC0 “.
Dans l’ACS Research Data Policy, l’American Chemical Society recommande l’utilisation d’une licence CC by : “To ensure data accessibility, we encourage the use of open licenses for reuse of data, such as Creative Commons CC BY”
Pour les data papers, dans le répertoire des data journals disponible sur DATACC, la fiche descriptive de chaque journal permet de voir quel type de licence est disponible.
Ressources
Outils
Il est possible de retrouver la Liste des licences utilisables pour être en conformité avec la Loi pour une République numérique.
Pour rappel, plusieurs outils permettent aux auteurs de jeux de données d’identifier la licence la plus appropriée aux usages prévus.
- Un outil généraliste : License selector
- Pour les licences Creative Commons : CC license chooser
Pour les codes et logiciels :
- le site choosealicense.com
- le Joinup Licensing Assistant, outil développé par l’UE.
La FAQ du site des Creative Commons peut également apporter des informations sur les conditions d’attribution des licences et détailler leur usage.
Plusieurs logigrammes permettent de s’orienter sur les conditions d’accès ou de partage de ses jeux de données. Ces logigrammes vont au-delà de la seule attribution de licences et permettent de couvrir un grand nombre de problématiques concernant la diffusion des données et la propriété des données :
- Institut de l’Information Scientifique et Technique. (2019). DoRANum-Aspects juridiques, éthiques, intégrité scientifique : Données de la recherche – contexte juridique : qui a les droits, quelles obligations ? DoRANum.
- « Aide à la décision sur la diffusion des données de recherche » du Cirad.
- Emilie Cotte, Fanny Sébire. Modèle de logigramme de l’Institut Pasteur relatif aux questions juridiques liées à la diffusion des données de la recherche. 2022. ⟨pasteur-03587216⟩
Guides
De nombreux guides et ressources sont disponibles sur DoraNum :
- Institut de l’Information Scientifique et Technique. (2022). DoRANum-Aspects juridiques, éthiques, intégrité scientifique : Guide des licences ouvertes. DoRANum.
- Institut de l’Information Scientifique et Technique. (2024). DoRANum-Aspects juridiques, éthiques, intégrité scientifique : fiche synthétique. DoRANum.
- Institut de l’Information Scientifique et Technique. (2023). DoRANum-Aspects juridiques, éthiques, intégrité scientifique : Les licences de réutilisation dans le cadre de l’Open data et de la loi pour une République numérique. DoRANum.
- Institut de l’Information Scientifique et Technique. (2023). DoRANum-Aspects juridiques, éthiques, intégrité scientifique : Aspects juridiques des bases de données . DoRANum .
Le comité Science Ouverte a également publié en 2022 un guide très complet : Cécile Arènes, Lionel Maurel, Stephanie Rennes. Guide d’application de la Loi pour une République numérique pour les données de la recherche. Comité pour la science ouverte. 2022. ⟨hal-03968218⟩
Le site du CIRAD explicite l’ensemble des licences. Voir : Fily, M.F. 2015. Connaî tre et utiliser les licences Creative Commons, en 6 points. Montpellier (FRA) : CIRAD, 11 p.
OpenAire présente un guide à destination des chercheurs : “How do I license my research data” voir Margoni, Thomas, & Tsiavos, Prodromos. (2018). Toolkit for Researchers on Legal Issues. Zenodo.
En 2022, une présentation a été faite sur les licences libres lors des Open Science Days de l’Université Grenoble Alpes : Clément Fontaine Mélanie. Licence libre, Open data et science ouverte : de quoi parle t-on ? 15 décembre 2022 : présentation et vidéo.