Les données de la recherche: Gérer, diffuser
Le statut juridique des données de la recherche
La notion de donnée ne correspond à aucune qualification juridique précise. Elle est donc assimilée à une information, qui est dite « de libre parcours » et ne confère aucun monopole légal à son détenteur.
Ainsi, contrairement aux créations classiques (logiciels, articles, etc.), les données ne génèrent pas, en tant que telles, un quelconque droit de propriété intellectuelle au profit de celui qui les crée, les détient ou les exploite – seule la structure de la base de données peut, pour peu qu’elle soit considérée comme originale, prétendre à une telle protection.
Formats et métadonnées
- Le principe de la libre circulation des données impose que certains types de formats soient utilisés. Ils doivent eux-mêmes obéir à un certain nombre de règles et reposer sur des standards reconnus qui permettent l'échange et la réutilisation.
- Certaines disciplines s’appuient sur des standards et des formats de métadonnées qui leur sont propres. Ils doivent être utilisés en priorité pour assurer l’interopérabilité des données entre les différents systèmes et les différents utilisateurs. Dans tous les cas, ces formats de métadonnées doivent être documentés.
Les exceptions au libre accès
Pour préserver le droit moral des jeux de données, les créatrices et créateurs doivent s'insérer dans le cadre d'une licence qui précise, tout en restant dans le cadre de l'open access, les conditions de réutilisation des données produites.
Selon la classification de l'Open Knowledge Foundation (OKF), trois types de licences peuvent être choisis :
- Public Domain Dedication and License (PDDL). Compatible avec la licence CC0, elle permet le partage des données produites, la création d'œuvres à partir des données libérées ou leur transformation sans aucune contrainte pour l'utilisateur.
- Attribution License (ODC-By). Compatible avec la Licence Ouverte Etalab, elle permet le partage des données produites, la création d'œuvres à partir des données libérées ou leur transformation, l'utilisateur ayant pour obligation de reconnaître la paternité du producteur des données.
- ODC Open Database License (ODC-OdbL). Elle permet le partage des données produites, la création d'œuvres à partir des données libérées ou leur transformation. Elle impose cependant à l'utilisateur de reconnaître la paternité du producteur, de partager les données dans les mêmes conditions et de laisser libres les nouveaux jeux de données produits.
Par défaut, les données issues de la recherche sont donc libres de diffusion. Toutefois, pour diverses raisons, certains types de données ne relèvent pas de ceprincipe et peuvent nécessiter des mesures de protection particulières. C'est le cas notamment pour :
-
les données scientifiques protégées en vue d'une exploitation industrielle ou commerciale
-
les données scientifiques à risque
-
les données de gestion
-
les données nominatives
-
les données stratégiques
Ces exceptions au libre accès aux données doivent toujours être justifiées et les mesures de restriction et de protection clairement indiquées.
Infrastructures et entrepôts
Stocker et donner accès aux données de manière pérenne, tout en garantissant leur interopérabilité, est un enjeu essentiel pour le monde de la recherche.
- Dans le domaine des sciences humaines et sociale, la très grande infrastructure de recherche Huma-Num a par exemple lancé l'entrepôt de données Nakala, qui est sécurisé et dont la mission est d'assurer à la fois l'accessibilité aux données et leur citabilité dans le temps.
- Ce service est complété par ISIDORE, dont le rôle est d'assurer le signalement et donc la visibilité des données produites tant pour la communauté scientifique que le grand public.
D'autres structures de ce type existent dans d'autres disciplines.