Aller au contenu principal

Les données de la recherche: Quelques repères

Introduire à la problématique des données de la recherche, avoir des repères historiques et terminologiques, connaître les enjeux, avoir des repères sur la gestion et la diffusion des données de la recherche.

Quelques chiffres

Le CNRS évaluait en 2014 à 2 millions le nombre de publiants mondiaux. Selon cette estimation, près de 90% des données de la recherche seraient stockées sur les disques durs locaux et potentiellement non réutilisables par d'autres... 2% des données seraient déposées dans des entrepôts numériques spécialisés (PetDB, TAIR...), quand 8% seraient dans des entrepôts de données généralistes (Dryad, Dataverse, dépôts institutionnels).

Les acteurs

De nombreux acteurs interviennent dans le cycle des données de recherche :

  • Les chercheurs et enseignants-chercheurs :
    •    production, gestion, validation des données, responsabilité du DMP...
  • Les bibliothécaires et documentalistes :
    •    indexation, gestion des métadonnées, participation à l'archivage, services aux chercheurs...
  • Les experts juristes :
    • conseils aux chercheurs pour les aspects juridiques
  • Les éditeurs :
    • validation, publication de données
  • Les ingénieurs-projet, les informaticiens:
    • interopérabilité, stockage, diffusion des données
    • gestion des entrepôts de données
  • Les formateurs IST :
    • sensibilisation, formation, services, conseils aux chercheurs...
  • Les établissements d'enseignement supérieur et de recherche :
    • politique d'établissement des données de recherche, financement de projets, responsabilité d'entrepôts institutionnels..
  • Les organismes de recherche :
    •   financement et gestion des infrastructures de rcherche, des entrepôts de données...
  • Les décideurs (Ministère, Commission Européenne...) :
    • politique générale des données de recherche, financement de projets européens...

Repères historiques

Le mouvement de l'ouverture des données de la recherche, l'Open Research Data, a une double origine :

- l’Open Access : le mouvement pour le Libre Accès des publications scientifiques (voir le guide Formadoct), lancé en 1991 avec la création de l’archive ouverte ArXiv, est directement à l’origine de l’Open Research Data, puisque dès 2003, la Déclaration de Berlin mentionnait la nécessité de rendre également accessibles les données de recherche ;

- l’Open Data : l’ouverture des données publiques prend sa source dans les politiques d’accessibilité aux documents administratifs et publics ; en France, la création de la CADA (Commission d’Accès aux Documents Administratifs) en 1978 a marqué une étape essentielle dans ce long mouvement vers l’ouverture et la transparence des données publiques. L’Open Data est désormais une politique officielle des pouvoirs publics.

Source de l'image : Jacquemont, Marie-Christine, Cosserat Françoise. Gestion et diffusion des données de la recherche, 2015. Support du stage de l'URFIST de Rennes, 11 juin 2015. Disp. sur : http://www.sites.univ-rennes2.fr/urfist/ressources/gestion-et-diffusion-des-donnees-de-la-recherche

Panorama des acteurs

Source de l'image : Jacquemont, Marie-Christine, Cosserat Françoise. Gestion et diffusion des données de la recherche, 2015. Support du stage de l'URFIST de Rennes, 11 juin 2015. Disp. sur : http://www.sites.univ-rennes2.fr/urfist/ressources/gestion-et-diffusion-des-donnees-de-la-recherche

Le cycle de vie des données

 
 Cycle de vie des données de la recherche (adapté de UK Data Archive)
 
Source de l'image : INIST. “Une introduction à la gestion et au partage des données de la recherche”. Nancy : INIST, septembre 2014. Disp. sur http://www.inist.fr/donnees/co/module_Donnees_recherche.html