Le théorème de Bayes en pratique : la formule qui sous-tend l'IA moderne
Une formule du XVIIIe siècle redevient centrale au XXIe. Comment un théorème de probabilités conditionnelles structure les filtres anti-spam, le diagnostic médical et l'apprentissage automatique.
Le théorème de Bayes a été publié en 1763, deux ans après la mort de son auteur. Pendant deux siècles, il a vécu une existence discrète dans les manuels de probabilité. Depuis trente ans, il est partout : dans les filtres anti-spam, les systèmes de diagnostic médical, les algorithmes de recommandation, les méthodes d'inférence en machine learning. Comprendre Bayes, c'est comprendre comment une machine raisonne sous incertitude.
La formule
Le théorème établit comment mettre à jour la probabilité d'une hypothèse à la lumière d'une nouvelle observation. Sa formulation tient en une ligne :
P(H | E) = P(E | H) × P(H) / P(E)
En mots : la probabilité d'une hypothèse H sachant une preuve E est égale à la probabilité de la preuve sachant l'hypothèse, multipliée par la probabilité a priori de l'hypothèse, divisée par la probabilité globale de la preuve.
Ce qui paraît une manipulation algébrique anodine cache une révolution conceptuelle : la probabilité n'est pas une propriété fixe d'un événement, c'est un degré de croyance qui se révise à chaque nouvelle information. C'est l'opposé de la statistique fréquentiste classique, qui considère les paramètres comme fixes et les données comme aléatoires.
L'exemple du test médical
Considérons un test de dépistage qui détecte une maladie avec 99 % de sensibilité (vrais positifs) et 99 % de spécificité (vrais négatifs). La maladie touche 1 personne sur 10 000 dans la population. Une personne est testée positive. Quelle est la probabilité qu'elle soit réellement malade ?
L'intuition dit : « 99 % ». La réponse réelle, donnée par Bayes, est environ 1 %. La raison : la maladie est si rare que les faux positifs (1 % de toute la population saine) écrasent les vrais positifs (99 % d'une infime fraction).
Cet exemple, classique mais déstabilisant, montre pourquoi le raisonnement bayésien doit être enseigné aux médecins, aux juges, aux décideurs. Sans lui, les conclusions tirées de tests probabilistes sont systématiquement biaisées.
Pourquoi l'IA a redécouvert Bayes
Le machine learning moderne est, dans une large mesure, une application massive du raisonnement bayésien. Un modèle qui apprend à partir de données fait exactement ce que Bayes propose : il met à jour ses paramètres internes (l'hypothèse) à la lumière des observations (les données d'entraînement).
Les premiers filtres anti-spam efficaces, dans les années 2000, étaient des classifieurs bayésiens naïfs : ils calculaient la probabilité qu'un mail soit du spam en fonction des mots qu'il contenait, en supposant l'indépendance conditionnelle des mots. Cette approche, simpliste sur le papier, fonctionnait étonnamment bien — et reste un baseline solide aujourd'hui.
Les méthodes plus modernes (réseaux de neurones, deep learning) sont plus opaques mais reposent sur la même logique : ajuster des paramètres pour maximiser la vraisemblance des données. Quand les chercheurs parlent de « priors », d'« inférence variationnelle » ou de « distributions a posteriori », ils manipulent du Bayes.
La leçon épistémologique
Au-delà des applications techniques, Bayes propose une discipline mentale. Face à une nouvelle information, ne pas demander « est-ce vrai ou faux ? » mais « comment cette information change-t-elle la probabilité de ce que je crois ? ». Cette posture — la révision continue des croyances, calibrée par la qualité de la preuve — est probablement la compétence intellectuelle la plus importante du XXIe siècle.
Elle est aussi la plus contraire à nos intuitions. Notre cerveau n'est pas câblé bayésien : il préfère les certitudes binaires aux probabilités graduées. C'est précisément pour cela que la formule, vieille de 250 ans, mérite d'être enseignée plus largement.
Auteur
Marcus Détrez
Fondateur d’IMAT137 et de LSI. Consultant en stratégie technologique et formation.
