Aller au contenu principal

Les données de la recherche: Introduction

Introduire à la problématique des données de la recherche, avoir des repères historiques et terminologiques, connaître les enjeux, avoir des repères sur la gestion et la diffusion des données de la recherche.

Lexique

Voir aussi

Pour citer ce guide

Serres, Alexandre, Vignale, François. "Les données de la recherche". In UBL (Université Européenne de Bretagne). Formadoct. Rennes : UBL, janvier  2016. Disp. sur : http://guides-formadoct.u-bretagneloire.fr/donnees_recherche

Qu'est-ce qu'une donnée ?

Selon l’OCDE, les données scientifiques (ou données de la recherche, research data) sont "des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique" . Photographies, images satellitaires, schémas ou dessins, relevés météorologiques, enregistrements sonores... en font par exemple partie.

Une donnée est ainsi une "description élémentaire d'une réalité". L'informaticien Serge Abiteboul donne un exemple simple de distinction entre donnée, information et connaissance : "Des mesures de température relevées chaque jour dans une station météo, ce sont des données. Une courbe donnant l’évolution dans le temps de la température moyenne dans un lieu, c’est une information. Le fait que la température sur Terre augmente en fonction de l’activité humaine, c’est une connaissance."

Une donnée est donc n'importe quel élément, n'importe quel enregistrement, prélevé ou construit, permettant de décrire n'importe quelle réalité : une mesure, un indice, un prélèvement, un chiffre, une lettre, une photo.... En soi, une donnée seule n'a aucune signification, elle ne prendra sens qu'avec le croisement, l'articulation avec d'autres données, ce qui donnera lieu à une information porteuse de sens. Les données peuvent être numériques ou non.

Qu'entend-on par données de la recherche ?

Les données de la recherche peuvent être définies comme "des enregistrements factuels (chiffres, textes, images, sons) utilisés comme source principales pour la recherche scientifique et généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. Un ensemble de données de recherche constitue une représentation systématique et partielle du sujet faisant l’objet de la recherche » (OCDE, 2007).

Plusieurs dimensions structurent les données de la recherche :

- l'enregistrement : ce sont des enregistrements factuels de la réalité, i.e. des données au sens classique du terme ;

- la source : ces enregistrements représentent le matériau, la source principale de l'activité de recherche scientifique ; il faudrait nuancer ici cette dimension pour les SHS ;

- la validation : les données de la recherche servent à la validation des résultats de la recherche ;

- la communicabilité : les données de la recherche doivent pouvoir être diffusées au sein de la communauté scientifique ;

- le traitement : les données doivent être adaptées à un traitement (souvent informatisé) pour pouvoir être exploitées.

Qu'est-ce qui ne relève pas des données de la recherche ?

Selon l'OCDE, les données de la recherche ne recouvrent pas un certain nombre de produits issus pourtant de la recherche, parmi lesquels : les carnets de laboratoire, les analyses préliminaires et les projets de documents scientifiques, les programmes de travaux futurs, les examens par les pairs, les communications personnelles avec des collègues (sous forme de mails, de forums par exemple), les objets matériels - par exemple, les échantillons de laboratoire, les souches bactériennes et les animaux de laboratoire tels que les souris, les publications scientifiques proprement.dites, les supports de formation, les données administratives, dès lors qu'elles ne sont pas intégrées dans un corpus de recherche...

La publication des données

Schéma adapté de Report on integration of data and publications. Opportunities for Data Exchange (Reilly S. et al., 2011)