Aller au contenu principal

L'identité numérique du chercheur: Identifiants numériques du chercheur

Ce guide présente l'intérêt de veiller à son identité numérique de chercheur afin de rendre les résultats de sa recherche plus visibles et de susciter des partenariats avec d'autres chercheurs.

Du nom à l'identifiant : rendre à César ce qui est à César

En 2011, le chercheur le plus prolifique s'appelait Y. Wang. Du moins, on pouvait lui attribuer 3927 publications au cours de cette année. Ce chercheur à la production miraculeuse évidemment n'existe pas. Les milliers d'articles écrits sous ce nom ont été en fait publiés par des dizaines de Y. Wang. Mais rien ne permettait jusqu'alors de distinguer ces multiples chercheurs sous ce patronyme extrèmement courant. Il en va de même pour les Smith, les Lee, les Zhang et autre Martin. 

Même rare, un prénom (surtout ramené à son initiale) et un nom ne suffisent pas toujours à identifier avec précision les articles écrits par une personne déterminée. Pour cette personne, l'enjeu est également d'ordre bibliométrique : pouvoir affilier de manière certaine ses articles à son identité de chercheur lui permettra d'être visible et de mesurer son impact sans risque d'erreur. C'est pourquoi tout chercheur a intérêt à se constituer un identifiant numérique qui le distingue de ses homonymes sans risque d'erreur. ORCID, ISNI, AureHAL sont quelques référentiels parmi les diziaines qui existent d'où pourra extraire les identifiants dont il a besoin, tout en étant en mesure de les articuler entre eux. 

image : badge de Arthur Compton à Hanford - CC:by Wikipedia

 

Identifiants et web semantique

La science des Big data n'est pas seulement rendue possible par la mise à disposition d'une énorme masse de données sur le web, mais aussi par une nouvelle structuration des relations que ces données entretiennent entre elles. C'est là l'enjeu du web sémantique dont l'organisation repose sur des concepts, individus et relations. Dans cette ontologie, l'individu doit être unique, c'est-à-dire désambiguisé, au moyen notamment d'un identifiant permettant de composer une URI.

Ainsi l'auteur du Corbeau, Edgar Allan Poe, peut être identifié grâce à cette URI http://data.bnf.fr/11920094/edgar_allan_poe/ (construite à partir du répertoire de la BNF. Son oeuvre, le Corbeau, est accessible est accessible dans son édition originale de 1845 sur le web à partir du même répertoire de données sous l'identifiant  http://catalogue.bnf.fr/ark:/12148/cb12038661v. Les relations entre cette édition originale et les éditions suivantes ou les traductions de cette oeuvre sont elles-même modélisées selon une norme (FRBR) afin qu'elles puissent être liées ensemble. 

La relation qui lie l'auteur et son oeuvre fait également l'objet d'une normalisation (ici la norme Dublin Core qui dispose d'un champ pour définir le créateur d'une oeuvre). 

Les identifiants uniques et les répertoires de données de plus en plus interopérables accroissent de manière exponentielle les possibilités d'analyse dont disposent les chercheurs qui se penchent sur ces corpus. C'est là tout l'enjeu du web des données : le bibliothécaire doit produire des métadonnées conformes à ces normes et lier les identités entre elles. Le chercheur, quant à lui, doit veiller à ce que ses productions lui soient correctement attribuées, ou bien que les identités du corpus qu'il étudie soient correctement réellement distinctes. 

Quel(s) identifiant(s) choisir ?

Orcid, Researcher_ID, Scopus_ID, Refdoc_ID, ISNI, VIAF, IDref, IdHal, ResearchGateID, IstexID, le vertige gagne facilement le chercheur devant le nombre d'identifiants qu'il est en mesure de se créer ou qu'il est susceptible d'avoir tout au long de sa carrière

Dans quel référentiel faut-il être absolument pour avoir la meilleure chance d'être visible ? Quel identifiant doit-on se créer pour qu'on puisse définitivement lier notre identité de chercheur avec les publications qu'on a réellement faites ?

Certains organismes, comme ORCID font des campagnes d'ampleur, ou persuadent des institutions d'affilier en masse tous leurs chercheurs. 

Directement lié au monde de la publication (les grands éditeurs sont présents dans le conseil d'administration d'ORCID, même si la majorité des voix doit provenir d'associations à but non lucratif), l'identifiant d'ORCID permet à chaque chercheur qui soumet un article d'indiquer sans ambuiguité à son éditeur qu'il est l'auteur de son texte (et non tel ou tel homonyme). Le crédit d'ORCID est grand à l'international et auprès des grands éditeurs

  • Cela dit, la plupart des identifiants créés avec ORCID sont pauvres en métadonnées (on se limite souvent à lier un nom et un prénom à un identifiant)
  • ORCID ne permet de lier à leur auteur que des articles. Il est inopérant pour ses autres supports (thèses, ouvrages)
  • ORCID n'est pas l'identifiant le plus répandu dans chaque pays. Les identifiants attribués par les bibliothécaires sont beaucoup plus répandus

Le saviez-vous ? Dès qu'un chercheur dépose sa thèse, un bibliothécaire lui attribue un identifiant. Cet identifiant est visible sur IDref. Il est riche en métadonnées (nom, prénom, date de naissance, activité, nom de la source - c'est à dire titre de la thèse, langue d'expression, etc.)

Par conséquent, même s'ils l'ignorent, car ils n'ont pas eu à le créer eux-mêmes, les chercheurs français sont beaucoup plus nombreux à disposer d'un identifiant IDref que d'un identifiant ORCID

L'identifiant IDref permet sans ambiguité de relier un auteur à sa thèse et aux ouvrages qu'il a publiés (tels qu'ils sont présents dans le catalogue national SUDOC)

L'enjeu pour les institutions de recherche, n'est donc pas de savoir quel est le référentiel le plus utilisé, ou le plus renommé, pour y inscrire leurs chercheurs, mais comment permettre l'alignement entre eux des différents identifiants existants afin qu'elles puissent associer à chacun de leur membre toute la production dont il est réellement l'auteur.

Cet alignement des référentiels est conditionné par leur interopérabilité et le respect de certaines normes de description des instances de recherche (le format CERIF notamment) 

Typologie des identifiants Auteurs

Impact et visibilité de la Recherche : les profils de chercheurs (B.U. d'Utrecht, Pays-Bas)