IMAT137
Retour au blog
Finance par les mathématiques··9 min

Le Paradoxe de Saint-Pétersbourg : quand les maths défient la rationalité

Comment le paradoxe de Saint-Pétersbourg révèle les limites de l'espérance mathématique et redéfinit notre compréhension de la rationalité décisionnelle en finance.

Le Paradoxe de Saint-Pétersbourg : quand les maths défient la rationalité

Introduction : une question qui a divisé les penseurs depuis trois siècles

Imaginez qu'on vous propose un jeu simple. Une pièce est lancée jusqu'à ce qu'elle tombe sur face. Si face apparaît au premier lancer, vous gagnez 2 euros. Si elle apparaît au deuxième, vous gagnez 4 euros. Au troisième, 8 euros. Et ainsi de suite : le gain double à chaque lancer supplémentaire. Combien seriez-vous prêt à payer pour jouer à ce jeu ?

La réponse mathématique est vertigineuse. L'espérance de gain est infinie. Pourtant, aucune personne sensée ne paierait 100 euros pour y jouer, et encore moins 1 000. C'est le paradoxe de Saint-Pétersbourg, formulé par Daniel Bernoulli en 1738, qui pose une question fondamentale : pourquoi l'espérance mathématique échoue-t-elle à prédire nos décisions concrètes ?

Ce paradoxe n'est pas qu'une curiosité mathématique. Il sonde les fondations mêmes de la théorie de la décision, de la gestion de portefeuille et de la pricing des actifs financiers. Comprendre ses implications permet de repenser la notion de rationalité en finance et de construire des modèles décisionnels plus robustes.

Le paradoxe explicité : l'espérance infinie du fini

Formulation mathématique précise

Soit une variable aléatoire X représentant le gain au jeu de Saint-Pétersbourg. La probabilité que face apparaisse au n-ième lancer est (1/2)^n. Si face apparaît au n-ième lancer, le gain est 2^n euros.

L'espérance mathématique s'écrit :

E[X] = Σ(n=1 à ∞) (1/2)^n × 2^n = Σ(n=1 à ∞) 1 = ∞

Chaque terme de la série vaut exactement 1 euro. Au premier lancer, la probabilité de gagner 2 euros est 1/2, contribuant 1 euro à l'espérance. Au second lancer, la probabilité de gagner 4 euros est 1/4, contribuant 1 euro. Et ainsi indéfiniment. La somme diverge.

Cette démonstration rigoureuse crée une tension insurmontable avec l'intuition. Si quelqu'un offre ce jeu à un prix fini quelconque, la théorie classique de l'espérance mathématique stipule qu'on devrait l'accepter, car l'espérance de gain est infinie. Pourtant, même les mathématiciens les plus chevaleresques refuseraient de payer 1 000 euros pour jouer. Cet écart révèle une faille majeure dans notre théorie de la valeur.

Pourquoi cette divergence crée-t-elle un problème ?

La théorie classique de la décision repose sur le principe suivant : un agent rationnel accepte toute transaction dont l'espérance mathématique est positive. C'est le cœur de l'analyse risque-rendement en finance. Or, le paradoxe de Saint-Pétersbourg montre que ce principe ne peut pas être appliqué tel quel. Si quelqu'un acceptait systématiquement tous les jeux d'espérance positive, il pourrait être ruiné par des jeux de ce type, malgré leur espérance infinie.

Considérez un individu auquel on propose 100 fois consécutives ce jeu, au prix de 10 euros chaque fois. L'espérance totale est infinie, mais la probabilité de perdre de l'argent sur ces 100 tentatives est non négligeable. En réalité, pour une durée de jeu finie, il existe une probabilité substantielle de perdre rapidement son capital initial. Le paradoxe révèle donc que l'espérance mathématique, bien que rigoureuse, n'est pas toujours le guide décisionnel approprié.

La solution de Bernoulli : l'utilité espérée

Le concept révolutionnaire d'utilité

Daniel Bernoulli proposa en 1738 une solution élégante : l'utilité d'une somme d'argent n'est pas proportionnelle à la somme elle-même, mais à son logarithme. En d'autres termes, la satisfaction que procure un gain de 2 euros n'est pas deux fois celle d'un gain de 1 euro ; elle est légèrement supérieure.

Formellement, Bernoulli introduisit une fonction d'utilité U(x) = ln(x), où x est le gain monétaire. L'utilité espérée devient :

E[U(X)] = Σ(n=1 à ∞) (1/2)^n × ln(2^n) = Σ(n=1 à ∞) (1/2)^n × n × ln(2)

Cette série converge. Le calcul explicite donne E[U(X)] ≈ 1,39 × ln(2) ≈ 0,96 euros. Soudain, le paradoxe s'évanouit. Un agent maximisant son utilité espérée ne paierait qu'environ 2-3 euros pour jouer, ce qui correspond bien mieux à nos intuitions comportementales.

L'intuition derrière la concavité de l'utilité

Pourquoi l'utilité serait-elle logarithmique, ou plus généralement concave ? Bernoulli invoqua le concept d'utilité marginale décroissante. Chaque euro supplémentaire apporte moins de satisfaction qu'le précédent. Pour un individu possédant 100 euros, un gain de 10 euros représente une amélioration substantielle. Pour un milliardaire, les mêmes 10 euros sont négligeables.

Cette intuition est puissante. Elle explique pourquoi les individus assurent les risques catégorisés, pourquoi les loteries nationales existent (les pauvres surévaluent les petits gains élevés), et pourquoi les portefeuilles d'investisseurs diffèrent selon leur richesse. La forme de la fonction d'utilité capture des préférences réelles.

Au-delà de Bernoulli : la théorie de l'utilité espérée moderne

Les axiomes de Von Neumann-Morgenstern

Cent ans plus tard, John Von Neumann et Oskar Morgenstern formalisèrent la théorie de l'utilité espérée sur des fondations axiomatiques rigoureuses. Ils montrèrent que si un décideur satisfait à quatre axiomes raisonnables (complétude, transitivité, continuité et indépendance), alors ses préférences peuvent être représentées par une fonction d'utilité U telle que maximiser E[U(X)] est équivalent à choisir l'option préférée.

Ces axiomes semblent incontestables au premier abord. La complétude suppose qu'on peut toujours comparer deux loteries. La transitivité stipule que si A est préféré à B et B à C, alors A est préféré à C. La continuité exige qu'il n'existe pas de sauts de préférence. L'indépendance affirme que si A est préféré à B, alors une loterie mélangeant A avec un tiers événement est préférée à une loterie mélangeant B avec le même événement.

Sur ces fondations, la théorie de l'utilité espérée devint le paradigme dominant de la théorie des décisions et de la finance théorique. C'est sur elle que repose le modèle de Markowitz, le CAPM, et la plupart des modèles de pricing d'actifs.

Implications pour la finance pratique

En finance, la théorie de l'utilité espérée justifie l'analyse risque-rendement. Un investisseur choisit un portefeuille en maximisant E[U(rendement)], où U reflète son aversion au risque. Les investisseurs avers au risque ont des fonctions d'utilité concaves ; ils préfèrent la certitude au pari équitable. Les investisseurs neutres au risque ont des fonctions linéaires. Les investisseurs amateurs de risque, rares en pratique, ont des fonctions convexes.

Cette théorie offre aussi une justification pour les primes de risque. Un portefeuille d'actions doit offrir un rendement attendu supérieur aux obligations pour compenser l'aversion au risque des investisseurs. L'écart entre le rendement des actions et des obligations, la fameuse « equity risk premium », s'explique par la concavité de l'utilité.

Les limites empiriques : les anomalies comportementales

Le paradoxe d'Allais et la violation de l'indépendance

Alors que la théorie semblait établie, Maurice Allais découvrit en 1953 une anomalie troublante. Considérez deux situations de choix.

Situation 1 : Choisir entre

  • Option A : 1 million d'euros avec certitude
  • Option B : 5 millions d'euros avec probabilité 10%, rien sinon (espérance : 0,5 million)

La plupart des gens choisissent A, refusant la loterie même si elle a une espérance inférieure.

Situation 2 : Choisir entre

  • Option C : 1 million d'euros avec probabilité 11%, rien sinon (espérance : 0,11 million)
  • Option D : 5 millions d'euros avec probabilité 10%, rien sinon (espérance : 0,5 million)

Là, la plupart des gens choisissent D, acceptant le risque. Pourtant, ces deux situations ne différent que par une réduction commune de 89% de la probabilité de recevoir quelque chose. L'axiome d'indépendance ne devrait pas être violé. Si on préfère A à B, on devrait préférer C à D.

Ce phénomène, appelé « effet de certitude », révèle que nos préférences dépendent du contexte de présentation, non seulement des probabilités objectives. La théorie de l'utilité espérée, trop restrictive, échoue à capturer cette dimension.

La théorie du prospect de Kahneman et Tversky

En réaction à ces anomalies, Daniel Kahneman et Amos Tversky développèrent la théorie du prospect (1979). Elle introduit plusieurs modifications majeures.

D'abord, les probabilités ne sont pas utilisées directement ; elles sont transformées par une fonction de pondération π(p) souvent non-linéaire. Les faibles probabilités sont surpondérées (les gens achètent des billets de loterie), tandis que les probabilités élevées sont sous-pondérées. Cette déformation explique des comportements irrationnels à première vue.

Deuxième, l'utilité ne s'évalue pas sur les niveaux finaux de richesse, mais sur les gains et pertes relatifs à un point de référence. Vous êtes face à deux scénarios : gagner 100 euros ou perdre 100 euros. L'utilité de la perte n'est pas le symétrique de celle du gain. Elle est généralement plus grande en valeur absolue. C'est l'aversion aux pertes : les gens détestent perdre 100 euros bien plus qu'ils n'aiment gagner 100 euros.

Troisièmement, les évaluations d'utilité reflètent des biais psychologiques systématiques : ancrage sur le prix affiché, effet de cadrage (même option présentée différemment provoque des choix différents), illusion de contrôle. Ces biais ne sont pas des erreurs corrigeables ; ils sont structurelles à la cognition humaine.

Le paradoxe de Saint-Pétersbourg à l'ère comportementale

Comment la théorie du prospect résout-elle le paradoxe ?

Sous la théorie du prospect, l'evaluation du jeu de Saint-Pétersbourg change radicalement. D'abord, les probabilités faibles sont surpondérées. Les joueurs surpondérent la probabilité infime mais réelle de gains astronomiques, ce qui augmente l'attrait apparent du jeu, mais pas infiniment.

Deuxième, l'utilité des gains très élevés est réduite par la concavité de la fonction de valeur. Mais contrairement à Bernoulli, cette concavité reflète non seulement la diminution marginale de la satisfaction monétaire, mais aussi la surévaluation des risques par la psyché humaine.

Troisièmement, le fait que les gains représentent de la richesse nouvelle plutôt que un état final de richesse change les calculs. Un gain inattendu de 1 000 euros est plus valorisé qu'une différence de richesse finale de 1 000 euros.

Ensemble, ces facteurs produisent une évaluation du jeu bien plus modeste, alignée avec les comportements observés. Le paradoxe ne disparaît pas ; il se dissout dans une théorie plus riche et empiriquement fondée.

Implications modernes pour les gestionnaires de portefeuille

Pour les professionnels de la finance, reconnaître les limites de la théorie classique et les biais comportementaux n'est pas académique. Les comportements irrationnels des investisseurs créent des anomalies de pricing que les gestionnaires peuvent exploiter.

L'aversion aux pertes, par exemple, explique pourquoi les actions croissance volatiles surperforment à long terme. Les investisseurs avers aux pertes demandent une prime de risque élevée pour ces actifs. Ceux qui acceptent cette volatilité bénéficient de rendements supérieurs.

L'effet de cadrage explique pourquoi les revenus de dividendes sont survalorises par rapport aux gains en capital équivalents : psychologiquement, un dividende « semble » être un revenu, tandis qu'une plus-value capital « ressemble » à du gain spéculatif.

Comprenez que la rationalité n'est pas l'absence de biais, mais l'exploitation systématique et réfléchie de ceux des autres.

Implications philosophiques et pratiques

La rationalité redéfinie

Le paradoxe de Saint-Pétersbourg et sa résolution progressive nous enseignent une leçon humilifiante : la rationalité n'est pas un état absolu, mais un construit théorique. Aucune théorie simple ne capture complètement comment les humains prennent des décisions.

Bernoulli mit l'accent sur la structure mathématique des préférences. Von Neumann et Morgenstern l'axiomatisèrent. Kahneman et Tversky mostrèrent que les axiomes sont violés systématiquement. Chaque avancée révélait non un achèvement, mais une couche plus profonde de complexité.

Une conclusion pratique émerge : la rationalité n'est pas un objectif à atteindre, mais un processus à raffiner continuellement. Les managers et investisseurs qui reconnaissent leurs biais—non pour les éliminer, ce qui est impossible, mais pour les comprendre et les anticiper—prennent des décisions meilleures que ceux qui prétendent à l'objectivité absolue.

Vers une théorie intégrée

La recherche contemporaine en finance comportementale tente une synthèse. Les modèles modernes combinent l'utilité espérée (pour sa rigueur mathématique), la théorie du prospect (pour son pouvoir explicatif), et des éléments de finance computationnelle (pour tester les prédictions sur données réelles).

Des chercheurs comme Richard Thaler plaidaient pour une économie plus humaine, intégrant la psychologie dans les modèles financiers. Cette approche n'affaiblit pas la théorie ; elle la renforce en la rendant plus prédictive et plus utile.

Conclusion : une invitation à la complexité

Le paradoxe de Saint-Pétersbourg, formulé il y a presque trois siècles, reste pertinent précisément parce qu'il expose un problème fondamental : nos modèles mathématiques, aussi élégants soient-ils, ne résument jamais complètement le comportement humain.

De Bernoulli à Kahneman, nous avons appris que l'espérance mathématique seule est insuffisante, que les préférences sont concaves, que les pondérations de probabilité sont non-linéaires, et que le contexte importe. Chaque étape a enrichi notre compréhension non pas en trouvant une réponse définitive, mais en posant des questions plus précises.

Pour les professionnels de la finance, l'implication est claire : la rationalité économique est un outil parmi d'autres, utile mais limité. Comprendre ce qu'elle capture et ce qu'elle omet permet de construire des modèles décisionnels plus nuancés, moins susceptibles aux surprises du marché.

Le paradoxe de Saint-Pétersbourg ne se résout donc jamais entièrement. Il se transforme. Et cette transformation continue est exactement ce qui garde la finance, et la décision humaine, vivantes et surprenantes.

Auteur

Marcus Détrez

Fondateur d’IMAT137 et de LSI. Consultant en stratégie technologique et formation.

LinkedIn

Continuer la lecture