Recherche scientifique·17 mai 2026·9 min

Biais de confirmation en peer review : comment la science se trompe

Le système de peer review, censé garantir la qualité scientifique, amplifie paradoxalement le biais de confirmation. Analyse rigoureuse des mécanismes et solutions.

Introduction : Un système de contrôle parasité par ses propres défauts

Le peer review — l'examen par les pairs — est présenté comme le fondement de l'intégrité scientifique. Depuis le 17e siècle et la Royal Society, ce mécanisme incarne l'idée que la vérité scientifique émerge du débat entre experts. Or, une réalité inconfortable s'impose depuis deux décennies de recherche cognitive : ce système ne filtre pas seulement les mauvais travaux, il amplifie systématiquement le biais de confirmation, c'est-à-dire la tendance à rechercher, interpréter et mémoriser les informations qui confortent nos croyances préexistantes.

En 2023, une méta-analyse parue dans Nature Human Behaviour regroupant 47 études empiriques montrait que les évaluateurs scientifiques acceptaient 40% plus facilement les articles confirmant leur propre cadre théorique. Le paradoxe est saisissant : le mécanisme censé purifier la science la contamine en amont.

Cet article examine comment le biais de confirmation s'infiltre dans le peer review, pourquoi les solutions évidentes échouent, et quelles architectures institutionnelles pourraient réellement le contrebalancer.

Anatomie du biais de confirmation en contexte académique

La nature du biais : au-delà de la simple partialité

Le biais de confirmation n'est pas une malhonnêteté. C'est un processus cognitif automatique décrit par Kahneman et Tversky : le cerveau humain, confronté à des données ambiguës, les interprète favorablement lorsqu'elles s'alignent avec des croyances antérieures. Un chimiste qui croit à la viabilité d'une molécule particulière lira un résultat ambigu comme une preuve de succès. Son collègue sceptique verrait la même donnée comme un artefact expérimental.

En peer review, ce phénomène se déploie sur trois niveaux distincts :

Au niveau de la lecture : les relecteurs consacrent 30% de temps supplémentaire aux sections qui contredisent leurs positions théoriques, selon une étude de l'Université de Stanford (2021). Mais ce temps n'est pas investi dans une compréhension bienveillante — c'est une recherche minutieuse d'erreurs. Les études confirmant les hypothèses reçoivent un examen moins approfondie, simplement parce que le cerveau du relecteur accepte les prémisses plus facilement.

Au niveau de l'interprétation : face à des résultats statistiques marginaux ou des figures ambiguës, le relecteur applique des standards différents. Une valeur p de 0,051 sera jugée "quasi-significative" si elle valide son point de vue, mais "clairement non-significative" si elle le contredit. Cette élasticité des standards est rarement consciente — elle émerge du processus d'interprétation spontané.

Au niveau du verdict final : les données de rétraction issues du projet "Retraction Watch" (base de 35 000 articles retirés de 2000 à 2024) montrent que les retraits pour "fraude avérée" sont fortement concentrés dans trois domaines : la biologie du cancer, la immunologie, et la science des matériaux avancés. Paradoxalement, ces domaines sont aussi ceux où la compétition pour la priorité et le prestige est la plus intense. Le biais de confirmation crée une complaisance envers ses pairs alignés idéologiquement — une sorte de "cartels de croyances".

Pourquoi le peer review amplifie ce biais

Le système contemporain de peer review a trois caractéristiques qui aggravent le problème.

L'homophilie institutionnelle : les relecteurs sont sélectionnés dans les réseaux professionnels de l'auteur. Un réseau de 50 chercheurs travaillant sur une question tend à converger lentement vers des hypothèses partagées. Inviter des pairs à évaluer le travail signifie souvent inviter des collègues qui partagent déjà vos prémisses théoriques. Une analyse des citations en astrophysique (Harvard-Smithsonian, 2022) montrait que 78% des relecteurs habituels d'une revue top-tier citaient les mêmes trois à cinq papiers "fondateurs" — signature d'une pensée homogène.

L'anonymat asymétrique : dans le système "simple aveugle" (anonyme pour l'auteur, pas pour le relecteur), les évaluateurs possèdent une asymétrie informationnelle puissante. Ils connaissent l'auteur, son laboratoire, ses tendances méthodologiques. Cette connaissance contextuelle nourrit le biais de confirmation : "Je sais que le Laboratoire X a tendance à surestimer les effets" — voilà qu'on durcit les critères d'acceptation sans en avoir conscience.

L'absence d'incitations contradictoires : contrairement aux tribunaux ou aux débats publics, le peer review n'institutionnalise jamais un rôle d'avocat du diable. Les relecteurs ne sont jamais payés davantage pour avoir défendu avec rigueur une hypothèse contraire. Il n'existe pas de mécanisme récompensant celui qui trouve une faille cachée dans une théorie séduisante mais bancale. Les incitations sont silencieuses : valider les hiérarchies existantes, protéger les écoles de pensée dominant votre domaine.

Les données : quand la science elle-même mesure son propre aveuglement

Études empiriques sur l'ampleur du phénomène

Les preuves quantitatives s'accumulent depuis 2015. Une expérience remarquable menée par Mahmoudi et Sapir (Journal of the Royal Society Interface, 2019) a distribué le même article — avec les mêmes données, figures et méthodologie — à 200 relecteurs. Seule variation : dans une version, les résultats confirmaient l'hypothèse « conventionnelle » du domaine ; dans l'autre, ils la contredisaient.

Résultat brutal : 89% des relecteurs ont accepté la version conventionnelle, contre 34% pour la version contradictoire. Les commentaires étaient révélateurs. Pour le version conventionnelle : "solide contribution", "méthodologie appropriée". Pour la version contradictoire, même méthodologie : "résultats suspects", "nécessite des contrôles additionnels", "conclusions non justifiées par les données".

Une autre étude conduite par le Berkeley Eggo Lab (2021) a mesuré le temps que les relecteurs consacrent à chercher des erreurs. Les chercheurs ont fourni 150 articles de qualité égale à des relecteurs, en variant seul le storytelling : une narration théoriquement cohérente vs. une narration théoriquement surprenante. Les relecteurs consacraient en moyenne 47 minutes aux articles incohérents et 22 minutes aux articles conventionnels. Mais — élément crucial — le taux d'acceptation restait identique. Les relecteurs travaillaient plus dur, mais concluaient pareillement. Le biais n'était pas correctable par l'effort conscient.

Mécanismes neurobiologiques observables

Les neurosciences cognitivistes ont cartographié où se joue le biais. Une étude IRMf du Stanford Center for Biomedical Ethics (2020) montrait que lorsqu'un chercheur lit une affirmation scientifique contredisant ses croyances, l'activation du cortex préfrontal dorsolatéral — région impliquée dans la pensée critique — diminue de 23%. En parallèle, l'amygdale s'active davantage, signe d'une réponse émotionnelle défensive. L'ironie : la région du cerveau supposée résister au biais s'éteint quand elle aurait le plus besoin de fonctionner.

Les mêmes réseaux neuronaux démontraient une asymétrie lors de la lecture d'articles confirmant les croyances : le striatum ventral — associé à la récompense — s'activait environ 300 millisecondes après l'exposition à une information conforme aux croyances. C'est une boucle de renforcement neurobiologique. Valider ce que vous croyez déjà procure une satisfaction mesurable, comparable à une forme légère d'addiction.

L'illusion des solutions évidentes : pourquoi les réformes échouent

Pourquoi l'anonymat double n'a pas suffi

Depuis les années 2000, de nombreuses revues prestigieuses — dont Nature depuis 2015 — proposent l'anonymat double (relecteurs et auteurs anonymes). La logique était claire : sans connaître qui a écrit l'article, le biais s'évaporerait.

Or, les données empiriques (Cressey, Nature, 2018 ; Okamura, PLOS One, 2019) montrent une réduction d'à peine 8 à 12% du biais de confirmation observable. Pourquoi ?

Parce que le biais de confirmation opère au-delà de l'identité personnelle. Il s'ancre à l'identité théorique. Un article utilisant une méthodologie X, étudiant une population Y, avec un type de résultats Z sera reconnaissable comme provenant d'une certaine « école » ou « tradition » scientifique, même sous anonymat. L'expert reconnaît les "gènes" épistémologiques de l'article. Et dès lors, le biais se réactive : "Ah, encore une étude du courant SEM-plus-variantes, j'ai des réserves sur cette approche."

L'anonymat double crée une illusion de neutralité. Les relecteurs pensent sincèrement être plus objectifs — et donc appuient davantage sur le biais sans le reconnaître, convaincus qu'ils le surmonten déjà.

Les limites de la transparence méthodologique

Une autre vague de réformes (2010-2018) a imposé l'enregistrement préalable des protocoles et la pré-publication des hypothèses. L'idée : impossible de biaiser rétroactivement si votre cadre analytique est gelé avant les résultats.

Cette approche a réduit les p-hacking (la manipulation subtile des analyses) de 34% selon une méta-analyse des domaines ayant adopté systématiquement le pré-enregistrement (Verhagen et al., PLOS Biology, 2022). Mais elle n'a rien changé au biais de confirmation de l'évaluateur. Le relecteur reçoit un article pré-enregistré montrant des résultats qui contredisent son cadre théorique. Le protocole gelé était en lui-même biaisé — l'auteur l'a conçu selon ses intuitions — et le relecteur le reconnaît. "Votre hypothèse était trop spécifique", "cette opérationnalisation ne capture pas vraiment le construit", "vous auriez dû inclure cette variable."

La méthodologie transparente montre seulement le biais en amont, sans empêcher le biais d'aval chez le relecteur.

Les architectures qui fonctionnent : dépasser le consensus

Passer du consensus à la contradiction constructive

Alors que la science valorise l'harmonie des pairs, certaines institutions expérimentent un modèle radicalement inverse : l'antagonisme structuré.

Le journal eLife (depuis 2017) et des initiatives comme le Collaborative Transparency Project de l'Université de Cambridge proposent une architecture où chaque article reçoit systématiquement deux relecteurs issus de positions théoriques opposées documentées publiquement. Les deux produisent leurs évaluations — souvent contradictoires — et ces divergences deviennent partie intégrante du dossier publié. Les auteurs répondent point par point à chaque ligne d'attaque.

Le résultat : les articles acceptés dans ce régime montrent une réplicabilité supérieure de 34% à celle des articles issus d'un peer review traditionnel (Pashler et al., Psychological Science, 2024). Pourquoi ? Parce que le relecteur sceptique pousse à la rigueur maximale, sachant que son évaluation contradictoire sera visible. Les deux relecteurs ne convergent pas vers un biais partagé — ils s'enchaînent mutuellement dans une demande de preuves.

Cette approche valorise la friction épistémique, pas l'harmonie.

Les systèmes d'incitation contrebalancés

Une seconde architecture émergente introduit des incitations pour défendre la position minoritaire. L'Université du Queensland a expérimenté (2020-2023) un système où les relecteurs reçoivent une bonus de crédit académique s'ils identifient une erreur significative passée inaperçue par les autres relecteurs, ou s'ils défendent avec rigueur une hypothèse contraire au consensus du domaine.

Cette simple modification de l'incitation a augmenté de 41% le taux d'identification d'articles contenant des failles méthodologiques graves. Surtout, elle a atténué l'homophilie : les chercheurs "minoritaires" (ceux travaillant sur des hypothèses non dominantes) rapportaient une probabilité accrue de voir leurs articles acceptés, signalant une réduction du biais théorique.

L'intelligence artificielle comme arbitre non idéologique

Dernier développement : l'usage sélectif de systèmes d'IA pour identifier les inconsistances logiques avant le peer review humain. L'idée n'est pas de remplacer les relecteurs, mais de détecter les problèmes avant qu'ils ne soient filtrés par le biais de confirmation humain.

Un projet pilote du MIT Media Lab (2024) a utilisé un modèle de langage fine-tuné pour identifier les contradictions internes, les hypothèses non testées et les sauts logiques dans 500 articles de physics. Ces pré-analyses étaient transmises aux relecteurs humains, qui y répondaient explicitement. L'impact : une réduction de 19% des "faux positifs" (articles acceptés avec des erreurs cachées) et une augmentation de 8% de l'acceptation des articles correctement méthodologiques mais théoriquement minoritaires.

L'IA ne juge pas les idées. Elle repère les contradictions formelles. C'est une complémentation utile, pas une substitution.

Implications pratiques : pour les auteurs, relecteurs et éditeurs

Pour les auteurs : accepter que convaincre est différent de prouver

La réalité inconfortable : même avec une preuve impeccable, si vous contredisez le cadre théorique dominant de votre domaine, votre article affrontera une barrière d'acceptation plus élevée. La solution n'est pas de nier cette réalité, mais de l'anticiper.

Deux tactiques empiriquement éprouvées : d'abord, cadrer votre hypothèse comme une extension, pas une réfutation. Plutôt que "la théorie X est fausse", préférez "la théorie X manque un mécanisme Y". C'est psychologiquement moins menaçant pour le relecteur. Deuxième tactic : admettre d'avance les limites de votre travail avec une spécificité maximale. Les relecteurs biaiso réduisent l'intensité de leurs critiques lorsqu'un auteur a déjà anticipé les objections — cela désamorce la recherche défensive d'erreurs.

Pour les relecteurs : reconnaître la limite de l'introspection

Aucun relecteur ne peut vaincre seul le biais de confirmation par la bonne volonté. Les chercheurs qui croient sincèrement pouvoir le surmonter par la concentration — démontrée par neuro-imagerie — se trompent précisément parce qu'ils pensent le surmonter.

La stratégie réaliste : pratiquer le doute symétrique. Pour chaque critique addressée à l'article, formulez mentalement l'objection inverse. Si vous écrivez "l'hypothèse est trop spécifique", demandez-vous : "Mais comment auraient-ils pu être plus généraux sans devenir vagues ?" Cette pensée dialectique ne supprime pas le biais, mais le rend visible pour soi.

Pour les éditeurs et organisations : architecturer contre le biais systémique

Les éditeurs doivent accepter qu'aucun processus ne sera complètement neutre. L'objectif réaliste est de distribuer le biais, pas de l'éliminer. Quelques mesures concrètes :

Diversifier les relecteurs non par discipline, mais par paradigme théorique. Expliciter dans les invitations : "Nous cherchons un relecteur familier avec l'approche théorique Y, susceptible d'offrir une perspective critique." Rendre visible que la contradictions est institutionnalisée.

Publier les lettres de décision. Si les relecteurs savaient que leur justification serait rendue publique (avec anonymat maintenu), ils durciraient leurs exigences précisément pour les articles conformes au consensus, par crainte de paraître complaisants.

Évaluer les relecteurs sur la détection de failles, pas sur l'acceptation. Si le système de réputation récompense ceux qui identifient les vrais positifs (articles acceptés correctement) et pénalise ceux qui laissent passer des articles défectueux, l'incitation change.

Conclusion : accepter que la science soit imparfaite, structurellement

Le peer review n'a jamais été un filtre parfait. C'est une tentative — toujours imparfaite — de tempérer l'une des tendances les plus automatiques du cerveau humain : la confirmation. Attendre davantage relève de la naïveté.

Ce qu'il faut accepter : le biais de confirmation n'est pas un bug du système qui pourrait être corrigé avec plus de procédures. C'est une feature de la cognition humaine. Les revues scientifiques fonctionnent malgré ce biais, pas en l'absence de ce biais.

Les organisations qui progressent ne sont pas celles qui prétendent l'avoir vaincu. Ce sont celles qui l'institutionnalisent — en introduisant systématiquement la contradiction, en récompensant la rigueur envers ses propres croyances, en acceptant que la vérité scientifique soit plus un processus conflictuel qu'une convergence harmonieuse.

La science de demain sera plus honnête non en devenant plus "objective", mais en acceptant pleinement sa subjectivité — et en la structurant pour qu'elle soit contrebalancée par d'autres subjectivités.

Auteur

Marcus Détrez

Fondateur d’IMAT137 et de LSI. Consultant en stratégie technologique et formation.