Aller au contenu principal

Les data papers: Introduction

Un data paper est une publication décrivant un ou plusieurs jeux de données scientifiques brutes. Il n'aborde pas les hypothèses et conclusions de leur analyse mais présente les méthodes d'extraction de ces données et facilite leur réutilisation en les r

Lexique : les datapapers

Voir aussi

Pour citer ce guide

Belghit, Karim; Belvèze, Clémence. "Les data papers". In UBL (Université Bretagne Loire), Formadoct. Rennes : UBL, juin 2016. Disp. sur : https://guides-formadoct.u-bretagneloire.fr/datapapers

En route vers l'Open data

Wikipedia, article Data Analysis by Martin Grandjean (CC-By-Sa-3.0)

Le mouvement de partage des données scientifiques ou data sharing, (...) est une réponse au besoin d’échanger le plus rapidement possible les résultats obtenus et de surmonter les obstacles juridiques et techniques à la circulation de ces données. 

Les politiques gouvernementales et européennes d’ouverture des données (open data) visent depuis quelques années à diffuser largement les données acquises grâce à des fonds publics.

Les enjeux éthiques du partage de données scientifiques : avis du COMETS (7 mai 2015)

Des individus, groupes et organisations se mobilisent pour réformer le processus de la communication scientifique et donner accès aux données utilisées par les chercheurs.

Quels outils existent aujourd'hui pour diffuser et valoriser ces informations brutes ?

  • les data papers et les data journals (depuis 2010)

  • les entrepôts de données

Définition et enjeux du data paper

Jusqu'à fin 2009, les données sur lesquelles s'appuyait une publication n'avait pas d'existence propre. Soit elles étaient mentionnées directement dans l'article, soit  dans des fichiers joints à l'article. Cela rendait difficile toute autre exploitation des données.

Un data paper est une publication décrivant un ou plusieurs jeux de données scientifiques brutes.

Ce qu'il contient :

  • des métadonnées et informations concernant les jeux de données (obtention, réutilisation,...)
  • un accès aux données par des hyperliens pérennes. Ces données peuvent provenir d'entrepôts différents.
  • une publication revue par les pairs
  • une liste des nouvelles analyses sur le jeux de données
  • une description lisible et structurée des données pour un humain

Ce qu'il ne contient pas : 

  • une interprétation des données

  • des conclusions sur l'analyse des données.

Quels sont les enjeux de ces publications ?

Il s'agit tout d'abord de stocker de manière pérenne les données : l'enregistrement sur un disque dur d'ordinateur ou sur un serveur de laboratoire n'est pas suffisant. Le risque est alors de perdre les données ou de ne plus pouvoir les lire si les outils changent.

Publier un data paper permet également de valoriser et faire connaître les jeux de données, ce qui en facilite la réutilisation. Le propriétaire des données bénéficie de la citation et est ainsi reconnu pour son travail de collecte.​

La publication des données

Schéma adapté de Report on integration of data and publications. Opportunities for Data Exchange (Reilly S. et al., 2011)