L'intégrité scientifique: Fraudes et méconduites
Diversité des fraudes et méconduites
On présente généralement la diversité des manquements à l’intégrité scientifique selon deux critères : par domaines ou selon leur degré de gravité.
La typologie par domaines vient des chercheurs Sgard et Michalowski[1], rapporteurs au Forum mondial de la Science de l’OCDE à Tokyo en février 2007 ; dans leur tableau, les fraudes et méconduites étaient réparties en six domaines :
Ces six domaines, qui ne sont pas exhaustifs, montrent une première cartographie des territoires des trois grandes régulations qui se déploient aujourd’hui dans le champ académique : l’intégrité scientifique (en rouge), l’éthique de la recherche (en violet) et la déontologie (en bleu), et qui se recouvrent partiellement. Ainsi les « pratiques de recherche inappropriée » se situent à la fois dans les domaines de l’éthique de la recherche et de l’intégrité scientifique ; les « conduites personnelles inappropriées » relèvent de la déontologie et de l’intégrité scientifique.
Une autre représentation des fraudes et méconduites répartit celles-ci selon un double axe : l’intentionnalité et la gravité. Ces deux critères ont permis une typologie intéressante, distinguant trois catégories, disposées selon une échelle de gravité et selon un axe Intentionnalité-Non intentionnalité : on y distingue ainsi la fraude, les Pratiques de Recherche Contestables et la méconnaissance méthodologique.
Adapté par Hervé Maisonneuve, « Biais et embellissements polluent la science »
Les Pratiques contestables de recherche (en anglais, Questionable Research Practices) : l’expression provient d’un article de 2012 de chercheurs en psychologie[2]. Cette notion permet de distinguer la fraude pure et dure de la « petite délinquance du savoir ». La « zone grise » des PRC constitue la partie immergée de l’iceberg de la « malscience », car à la différence de la fraude, elles touchent de très nombreux chercheurs, dans toutes les disciplines. C’est la partie invisible, la plus difficile à détecter, la moins spectaculaire, mais la plus répandue ! Ces pratiques de recherche contestables touchent tous les domaines du processus scientifique, tous les aspects du travail des chercheurs.
[1] F. Sgard, S. Michalowski, « Intégrité scientifique : vers l’élaboration de politiques cohérentes »
[2] John, Leslie K., George Loewenstein, et Drazen Prelec. « Measuring the Prevalence of Questionable Research Practices With Incentives for Truth Telling ». Psychological Science 23, no 5, mai 2012
La fraude scientifique générique
On définit la fraude scientifique comme « une violation sérieuse et intentionnelle dans la conduite d’une recherche et dans la diffusion de résultats », excluant par là-même « les erreurs de bonne foi ou les différences honnêtes d’opinion »[1]. Deux aspects essentiels caractérisent donc la fraude :
- son caractère volontaire, délibéré ; la véritable fraude ne peut être involontaire, on ne peut « fabriquer » des données ou bien plagier le travail d’un autre chercheur par inadvertance ;
- son caractère de gravité : la fraude scientifique a toujours des conséquences graves, parfois dramatiques, que ce soit à l’échelle individuelle, collective ou sociale (depuis l’impact d’un plagiat pour la personne plagiée jusqu’à l’exemple célèbre de l’article frauduleux sur le lien supposé entre vaccination et autisme du gastro-entérologue britannique Andrew Wakefield.
La fraude scientifique est désignée par le sigle des FFP, qui correspond à la définition donnée par l’OSTP[2] en 2000 : « la faute grave recouvre trois réalités : « fabrication, falsification, plagiat » (FFP) – « que ce soit dans un projet de recherche, dans l’exécution, dans la procédure du peer review, ou dans la citation ».
Fabrication des données
- Fabriquer = forger de toutes pièces les données d’une recherche, « la fabrication est la composition de données, leur enregistrement et leur présentation. »[1].
- Avec la fabrication des données, nous sommes au sommet de la fraude, et les conséquences sont généralement très graves : des résultats scientifiques faux, biaisés, pouvant fausser les autres recherches ;
Deux exemples célèbres de fabrication de données :
- L’affaire Schön, en physique :
- Jan Hendrik Schön, chercheur allemand en physique, recruté aux Bell Labs, et reconnu coupable en 2002 de fabrication de données ;
- Voir https://journals.openedition.org/histoire-cnrs/566
- L’affaire Stapel, en psychologie sociale :
- le chercheur en psychologie sociale, Diederik Stapel, de l’université de Tilburg (Pays-Bas), contraint en 2011, de rétracter 55 articles sur 130. « Il avait inventé l’essentiel des données de ses articles durant dix ans ». Il a été licencié de son université
- Voir http://passeurdesciences.blog.lemonde.fr/2012/12/09/le-scandale-stapel-ou-comment-un-homme-seul-a-dupe-le-systeme-scientifique/
- Exemples célèbres de fabrications de données : https://lejournal.cnrs.fr/articles/sept-cas-celebres-de-scientifiques-accuses-de-fraude
[1] J.P. Alix, « Renforcer l’intégrité de la recherche en France. Propositions de prévention et de traitement de la fraude scientifique », 2010, p. 18
Falsification des données
- Falsifier, c’est altérer intentionnellement les données de façon à les rendre plus conformes aux hypothèses que l’on privilégie
- La falsification comprend « La manipulation, la modification ou l’omission de données, de documents originaux, de méthodes ou de résultats, y compris les graphiques et les images, sans le mentionner, ce qui fausse les résultats ou les conclusions » (Manquements à la conduite responsable en recherche, Université de Laval, Québec)
- La falsification des données recouvre une certaine variété de pratiques, puisqu’elle se définit comme « la manipulation de procédures de recherche ou la transformation ou l’omission de données. »[1]. Elle est souvent difficile à prouver, en raison de cette diversité de formes.
Un exemple célèbre de falsification de données :
- L’affaire Andrew Wakefield :
- Le chirurgien Andrew Wakefield, qui avait publié en 1999 un article suggérant un lien de causalité entre le vaccin ROR (Rougeole Oreillons Rubéole) et l’autisme, provoquant une grave crise de confiance envers les vaccins en Grande-Bretagne et aux Etats-Unis, a été reconnu coupable en 2004 de corruption et surtout d’avoir falsifié ses données. Son article sera rétracté par The Lancet en 2010. Voir : https://www.encyclopedie-environnement.org/zoom/une-fraude-scientifique-aux-consequences-tragiques-le-vaccin-ror-et-lautisme/
[1] J.P. Alix, « Renforcer l’intégrité de la recherche en France. Propositions de prévention...», 2010, p. 18
Le plagiat
- « Le plagiat dans la recherche scientifique consiste principalement en une appropriation frauduleuse de textes ou de résultats d’autrui. » (Rapport COMETS)
- D’une grande complexité, le plagiat relève d’au moins trois dimensions différentes, appelant trois types de réponses :
- le plagiat comme « négligence » informationnelle : phénomène de société par son ampleur, ce plagiat étudiant traduit surtout la méconnaissance des règles de citation, la paresse intellectuelle, le défaut de méthode ; il appelle avant tout des réponses pédagogiques, de sensibilisation et de formation ;
- le plagiat comme fraude scientifique, vol littéraire : selon le Petit Robert de 2005, le plagiat est un «Vol littéraire. Le plagiat consiste à s’approprier les mots ou les idées de quelqu’un d’autre et à les présenter comme siens ». Dans cette perspective, le plagiat est défini par la recopie servile, l’emprunt abusif, et il constitue une entorse à l’éthique, une fraude intellectuelle, dont la gravité peut être variable. Cette dimension concerne au premier chef l’intégrité scientifique. Les réponses ici relèvent surtout de la sanction, qu’elle soit administrative, morale, disciplinaire, et de la dénonciation publique (rétractation d’articles plagiaires).
- le plagiat comme délit, lorsqu’il est qualifié en contrefaçon : « Est également un délit de contrefaçon toute reproduction, représentation ou diffusion, par quelque moyen que ce soit, d'une oeuvre de l'esprit en violation des droits de l'auteur, tels qu'ils sont définis et réglementés par la loi. » (Code de la Propriété Intellectuelle, article L335-3). C’est lorsque le « vol de mots » viole également la propriété intellectuelle (si le plagiat est vraiment constitué, s’il porte sur un auteur vivant, ou ne relevant pas encore du domaine public), que le plagiat peut devenir un délit, passible des tribunaux. Si le rôle des acteurs de l’intégrité scientifique consiste ici à établir les preuves du délit, la réponse sera au final judiciaire.
- Les formes du plagiat scientifique sont diverses ; on peut distinguer les quatre formes suivantes :
- La copie ou le « vol » de textes, avec de nombreuses modalités : la copie intégrale, la paraphrase, le patchwork, le plagiat de traductions…
- L’appropriation des résultats d’un autre : par exemple, l’appropriation indue des résultats d’un travail de thèse…
- Le vol d’idées, de données : si le vol d’idées peut constituer une malhonnêteté intellectuelle, il ne constituera un plagiat que si ces idées ont reçu une forme écrite « Il faut savoir que le plagiaire ne commet pas de faute, ni de délit, dès lors qu’il n’emprunte que des idées et non la forme qui exprime celles-ci. » (COMETS, 2014) « Les idées sont de libre parcours », selon la formule consacrée ;
- L’auto-plagiat, notamment à travers le salami slicing (le découpage d’un travail en plusieurs parties pour en faire plusieurs articles, avec la recopie de parties rédigées par soi-même) ; mais l’auto-plagiat reste parfois difficile à établir et à qualifier.
- Des exemples célèbres de plagiats :
- Le plagiaire en série Elias Alsabti : voir http://www.bruno-jarrosson.com/limposture-scientifique-ou-la-creation-sans-objet/
- Liens :
Les pratiques contestables concernant les données
- L’embellissement des données (beautification of data) : « L’embellissement des données consiste à rapporter les résultats d’une étude sous une forme ne correspondant pas exactement à la réalité afin de les présenter sous un jour plus favorable ou plus attractif. »[1]
- Qu’est-ce qui distingue « l’embellissement » de la falsification des données ? La distinction n’est pas toujours facile et la frontière entre fraude et pratique contestable est poreuse. Comme l’indiquent Seror et Ravaud, « c’est le caractère intentionnel et la répétition de ces « arrangements » qui font basculer vers la véritable fraude délibérée. ».
- Des pratiques très diversifiées : selon une étude anglaise, « plus de 60 manières d’« arranger les données » ont été identifiées », bien expliquées dans l’article de Seror et Ravaud. Par exemple :
- changer de critère de jugement au cours d’une expérience
- « Rapporter des calculs d’effectifs réalisés a posteriori comme s’ils avaient été faits a priori »
- « déclarer que l’essai est en double aveugle alors qu’il ne l’est pas »
- « donner une conclusion non conforme aux données présentées »
- etc.
- La dissimulation ou la destruction de données :
- La dissimulation de données est le refus d'accorder à des tiers dûment autorisés le droit de consulter les données de base (selon l’université de Liège).
- La destruction de ses données ou dossiers de recherche ou de ceux d’une autre personne est plus grave : elle vise à « éviter spécifiquement la découverte d’un acte répréhensible en violation de l’entente de financement, des politiques de l’établissement, des lois, des règlements ou des normes professionnelles ou disciplinaires applicables » (Fonds de Recherche du Québec).
[1] Seror, R., Ravaud, P. « Embellissement des données : fraude a minima, incompétence ou un mélange des deux », La Presse Médicale, tome 41, no 9, septembre 2012
Les pratiques de recherche contestables dans les publications
Dans les activités de publication, centrales dans la vie et la carrière des chercheurs, on relève malheureusement plusieurs pratiques de recherche questionnables, touchant à différents aspects de la publication scientifique :
- la paternité des articles : adjonction d’auteurs « honorifiques » par complaisance, mention d’une personne en qualité de co-auteur sans son accord, « oubli » d’un co-auteur, absence de remerciements, conflits dans l’ordre des signatures, etc.[1] ;
- les références : références erronées, citations erronées, occultation volontaire d’auteurs… ;
- le rythme de publication : publication des mêmes travaux dans plusieurs journaux (salami slicing) ;
- le choix des revues : publication ou participation volontaire dans des revues dites prédatrices[2].
Sans compter les éventuels conflits d’intérêt dans le reviewing, les pratiques contestables de révision d’articles…
[1] Sur les conflits d’auteur, voir la brochure de l’INSERM : INSERM, Délégation à l’intégrité scientifique. « Signature des publications scientifiques : les bonnes pratiques ». INSERM, mars 2018.
[2] Sur les revues prédatrices, voir la page : https://openaccess.univ-rennes1.fr/les-revues-predatrices
Quelle réalité du phénomène de la fraude et des méconduites scientifiques ?
La fraude scientifique n’a rien d’un phénomène nouveau, et l’histoire des sciences donne des exemples célèbres de cas de fraudes (voir « Trois illustres fraudeurs passés à la postérité »). Le lointain précurseur de l’informatique, Charles Babbage, avait repéré, en 1830, les grands types de fraudes, même si les termes ont un peu changé : le « forgeage », i.e. la fabrication, ou la falsification des données, le « parage » ou la taille des données expérimentales, la « cuisson » ou le cuisinage des données.
Aujourd’hui, quelle serait la réalité, l’ampleur de la fraude scientifique ? Il est très difficile de la quantifier avec précision, compte tenu des problèmes de délimitation entre fraudes et pratiques contestables, mais aussi des disparités entre disciplines (par exemple, la biologie, la médecine, la psychologie sont beaucoup plus touchées par les méconduites scientifiques que la physique ou les mathématiques). Cependant, un chiffre est assez souvent cité : « De 1 à 2 % des 1 400 000 articles scientifiques publiés annuellement dans le monde, soit environ 20 000 articles, sont considérés comme frauduleux ». (d’après un Rapport de l’OPECST publié dans le JO du Sénat, 30/07/2015).
Si la fraude générique (les FFP) touche une petite minorité d’articles, les pratiques contestables de recherche (les PRC) sont en revanche beaucoup plus fréquentes, même si elles sont encore plus difficiles à chiffrer.
Une enquête publiée en 2009 (« How Many Scientists Fabricate and Falsify Research ? A Systematic Review and Meta-Analysis of Survey Data », Daniele Fanelli, Plos One, 2009, vol. 4 (5), 5738 in https://lejournal.cnrs.fr/articles/fraude-mais-que-fait-la-recherche) avait donné des résultats saisissants, notamment sur la perception des méconduites… chez les autres chercheurs :
- 1,97 % des chercheurs admettaient avoir eux-mêmes au moins une fois falsifié leurs données expérimentales, mais 14,12 % affirmaient avoir déjà observé ce type d’inconduites chez leurs collègues ;
- 33,7 % d’entre eux reconnaissaient s’être livrés à d’autres pratiques relevant de l’inconduite (les PRC), mais 72 % déclaraient les avoir vues commises par d’autres chercheurs !!