17 avril 2021 17:14

Induction en arrière

Qu’est-ce que l’induction rétrograde?

L’induction en arrière en théorie des jeux est un processus itératif de raisonnement en arrière dans le temps, à partir de la fin d’un problème ou d’une situation, pour résoudre une forme étendue finie et des jeux séquentiels, et en déduire une séquence d’actions optimales.

Induction vers l’arrière expliquée

L’induction en arrière a été utilisée pour résoudre des jeux depuis que John von Neumann et Oskar Morgenstern ont établi la théorie des jeux comme sujet académique lorsqu’ils ont publié leur livre, Theory of Games and Economic Behavior en 1944.

A chaque étape du jeu, l’induction vers l’arrière détermine la stratégie optimale du joueur qui effectue le dernier coup dans la partie. Ensuite, l’action optimale de l’avant-dernier joueur en mouvement est déterminée, en prenant l’action du dernier joueur comme donnée. Ce processus se poursuit en arrière jusqu’à ce que la meilleure action pour chaque point dans le temps ait été déterminée. En effet, on détermine l’ équilibre de Nash de chaque sous-jeu du jeu original.

Cependant, les résultats déduits de l’induction rétrograde ne permettent souvent pas de prédire le jeu humain réel. Des études expérimentales ont montré que le comportement «rationnel» (tel que prédit par la théorie des jeux) est rarement présenté dans la vie réelle. Les joueurs irrationnels peuvent en fait finir par obtenir des gains plus élevés que ceux prédits par l’induction arrière, comme illustré dans le jeu des millepattes.

Dans le jeu au mille-pattes, deux joueurs ont alternativement une chance de prendre une plus grande part d’un pot d’argent croissant, ou de passer le pot à l’autre joueur. Les gains sont arrangés de telle sorte que si le pot est passé à son adversaire et que l’adversaire prend le pot au tour suivant, on reçoit un peu moins que si l’on avait pris le pot sur ce tour. Le jeu se termine dès qu’un joueur prend la réserve, avec ce joueur recevant la plus grande partie et l’autre joueur recevant la plus petite partie.

Exemple d’induction vers l’arrière

À titre d’exemple, supposons que le joueur A commence et doit décider s’il doit «prendre» ou «passer» la réserve, qui s’élève actuellement à 2 $. S’il prend, alors A et B gagnent 1 $ chacun, mais si A passe, la décision de prendre ou de passer doit maintenant être prise par le joueur B. et A obtient 0 $. Mais si B passe, A peut maintenant décider de prendre ou de passer, et ainsi de suite. Si les deux joueurs choisissent toujours de passer, ils reçoivent chacun un gain de 100 $ à la fin de la partie.

Le but du jeu est que si A et B coopèrent tous les deux et continuent de passer jusqu’à la fin du jeu, ils obtiennent le paiement maximum de 100 $ chacun. Mais s’ils se méfient de l’autre joueur et s’attendent à ce qu’ils «saisissent» à la première occasion, l’équilibre de Nash prédit que les joueurs prendront la réclamation la plus basse possible (1 $ dans ce cas).

L’équilibre de Nash de ce jeu, où aucun joueur n’est incité à s’écarter de la stratégie choisie après avoir considéré le choix d’un adversaire, suggère que le premier joueur prendrait le pot au tout premier tour de la partie. Cependant, en réalité, relativement peu d’acteurs le font. En conséquence, ils obtiennent un gain plus élevé que le gain prédit par l’analyse des équilibres.

Résolution de jeux séquentiels à l’aide de l’induction vers l’arrière

Voici un jeu séquentiel simple entre deux joueurs. Les étiquettes avec le joueur 1 et le joueur 2 à l’intérieur sont les ensembles d’informations pour les joueurs un ou deux, respectivement. Les nombres entre parenthèses au bas de l’arbre sont les gains à chaque point respectif. Le jeu est également séquentiel, donc le joueur 1 prend la première décision (à gauche ou à droite) et le joueur 2 prend sa décision après le joueur 1 (vers le haut ou vers le bas).

L’induction à rebours, comme toute théorie des jeux, utilise les hypothèses de rationalité et de maximisation, ce qui signifie que le joueur 2 maximisera ses gains dans n’importe quelle situation donnée. À l’un ou l’autre ensemble d’informations, nous avons deux choix, quatre en tout. En éliminant les choix que le joueur 2 ne choisira pas, nous pouvons affiner notre arbre. De cette façon, nous marquerons les lignes en bleu qui maximisent le gain du joueur à l’ensemble d’informations donné.

Après cette réduction, le joueur 1 peut maximiser ses gains maintenant que les choix du joueur 2 sont connus. Le résultat est un équilibre trouvé par induction en arrière du joueur 1 choisissant «droite» et du joueur 2 choisissant «haut». Voici la solution du jeu avec le chemin d’équilibre en gras.

Par exemple, on pourrait facilement mettre en place un jeu similaire à celui ci-dessus en utilisant des entreprises comme joueurs. Ce jeu peut inclure des scénarios de sortie de produit. Si la société 1 voulait lancer un produit, que pourrait faire la société 2 en réponse? La société 2 lancera-t-elle un produit concurrent similaire? En prévoyant les ventes de ce nouveau produit dans différents scénarios, nous pouvons mettre en place un jeu pour prédire comment les événements pourraient se dérouler. Voici un exemple de la façon dont on pourrait modéliser un tel jeu.