17 avril 2021 16:21

Comment la stratégie de la théorie des jeux améliore la prise de décision

Table des matières

Développer

  • Le dilemme du prisonnier
  • Pièces de monnaie assorties
  • Impasse
  • Concours Cournot
  • Jeu de coordination
  • Jeu de mille-pattes
  • Le dilemme du voyageur
  • Bataille des sexes
  • Jeu de dictateur
  • Guerre de paix
  • Le dilemme du bénévolat
  • Questions fréquemment posées
  • La ligne de fond

La théorie des jeux, l’étude de la prise de décision stratégique, rassemble des disciplines disparates telles que les mathématiques, la psychologie et la philosophie. La théorie des jeux a été inventée par John von Neumann et Oskar Morgenstern en 1944 et a parcouru un long chemin depuis. L’importance de la théorie des jeux pour l’analyse et la prise de décision modernes peut être mesurée par le fait que depuis 1970, jusqu’à 12 économistes et scientifiques de premier plan ont reçu le prix Nobel de sciences économiques pour leurs contributions à la théorie des jeux.

La théorie des jeux est appliquée dans un certain nombre de domaines, notamment les affaires, la finance, l’économie, les sciences politiques et la psychologie. Comprendre les stratégies de la théorie des jeux – à la fois les plus populaires et certains des stratagèmes relativement moins connus – est important pour améliorer ses capacités de raisonnement et de prise de décision dans un monde complexe.

Points clés à retenir

  • La théorie des jeux est un cadre permettant de comprendre le choix dans des situations entre joueurs concurrents.
  • La théorie des jeux peut aider les joueurs à prendre des décisions optimales lorsqu’ils sont confrontés à des acteurs indépendants et concurrents dans un cadre stratégique.
  • Une forme de «jeu» courante qui apparaît dans les situations économiques et commerciales est le dilemme du prisonnier, où les décideurs individuels sont toujours incités à choisir d’une manière qui crée un résultat moins qu’optimal pour les individus en tant que groupe.
  • Plusieurs autres formes de jeu existent. L’application pratique de ces jeux peut être un outil précieux pour aider à l’analyse des industries, des secteurs, des marchés et de toute interaction stratégique entre deux ou plusieurs acteurs.

Le dilemme du prisonnier

L’une des stratégies de théorie des jeux les plus populaires et les plus élémentaires est le dilemme du prisonnier. Ce concept explore la stratégie de prise de décision adoptée par deux personnes qui, en agissant dans leur propre intérêt individuel, aboutissent à de pires résultats que si elles avaient coopéré en premier lieu.

Dans le dilemme du prisonnier, deux suspects appréhendés pour un crime sont détenus dans des pièces séparées et ne peuvent pas communiquer entre eux. Le procureur informe individuellement le suspect 1 et le suspect 2 que s’il avoue et témoigne contre l’autre, il peut être libéré, mais s’il ne coopère pas et que l’autre le fait, il sera condamné à trois ans de prison. Si les deux avouent, ils seront condamnés à une peine de deux ans, et si aucun des deux ne s’avoue, ils seront condamnés à un an de prison.

Bien que la coopération soit la meilleure stratégie pour les deux suspects, face à un tel dilemme, les recherches montrent que la plupart des personnes rationnelles préfèrent avouer et témoigner contre l’autre personne plutôt que de garder le silence et de prendre le risque que l’autre partie avoue.



On suppose que les joueurs dans le jeu sont rationnels et s’efforceront de maximiser leurs gains dans le jeu.

Le dilemme du prisonnier jette les bases de stratégies avancées de théorie des jeux, parmi lesquelles les plus populaires incluent:

Pennies assortis

Il s’agit d’un jeu à somme nulle qui implique deux joueurs (appelez-les Joueur A et Joueur B) plaçant simultanément un centime sur la table, le gain dépendant du fait que les centimes correspondent ou non. Si les deux centimes sont pile ou face, le joueur A gagne et garde le centime du joueur B. S’ils ne correspondent pas, le joueur B gagne et garde le sou du joueur A.

Impasse

Il s’agit d’un scénario de dilemme social comme le dilemme du prisonnier en ce que deux acteurs peuvent soit coopérer, soit faire défection (c’est-à-dire ne pas coopérer). Dans une impasse, si le joueur A et le joueur B coopèrent tous les deux, ils obtiennent chacun un gain de 1, et s’ils font tous deux défaut, ils obtiennent chacun un gain de 2. Mais si le joueur A coopère et le joueur B fait défaut, alors A obtient un gain. de 0 et B obtient un gain de 3. Dans le diagramme de gains ci-dessous, le premier chiffre dans les cellules (a) à (d) représente le gain du joueur A, et le deuxième chiffre est celui du joueur B:

L’impasse diffère du dilemme d’un prisonnier en ce que l’action du plus grand bénéfice mutuel (c’est-à-dire les deux défauts) est également la stratégie dominante. Une stratégie dominante pour un joueur est définie comme celle qui produit le meilleur rendement de toute stratégie disponible, quelles que soient les stratégies employées par les autres joueurs.

Un exemple fréquemment cité de blocage est celui de deux puissances nucléaires qui tentent de parvenir à un accord pour éliminer leurs arsenaux de bombes nucléaires. Dans ce cas, la coopération implique l’adhésion à l’accord, tandis que la défection signifie le reniement secret de l’accord et la conservation de l’arsenal nucléaire. Le meilleur résultat pour l’une ou l’autre nation, malheureusement, est de revenir sur l’accord et de conserver l’option nucléaire tandis que l’autre nation élimine son arsenal, car cela donnera au premier un énorme avantage caché sur le second si jamais une guerre éclate entre les deux. La deuxième meilleure option est que les deux fassent défection ou ne coopèrent pas, car cela conserve leur statut de puissances nucléaires.

Concours Cournot

Ce modèle est également conceptuellement similaire au dilemme du prisonnier et porte le nom du mathématicien français Augustin Cournot, qui l’a introduit en 1838. L’application la plus courante du modèle de Cournot consiste à décrire un duopole ou deux principaux producteurs sur un marché.

Par exemple, supposons que les entreprises A et B produisent un produit identique et peuvent produire des quantités élevées ou faibles. S’ils coopèrent tous les deux et acceptent de produire à de faibles niveaux, alors l’ offre limitée se traduira par un prix élevé pour le produit sur le marché et des bénéfices substantiels pour les deux entreprises. D’un autre côté, s’ils font défaut et produisent à des niveaux élevés, le marché sera submergé et se traduira par un prix bas pour le produit et par conséquent une baisse des bénéfices pour les deux. Mais si l’un coopère (c.-à-d. Produit à de faibles niveaux) et les autres défauts (c.-à-d. Produit subrepticement à des niveaux élevés), alors le premier atteint simplement l’équilibre tandis que le second réalise un profit plus élevé que s’ils coopéraient tous les deux.

La matrice des gains pour les entreprises A et B est présentée (les chiffres représentent les bénéfices en millions de dollars). Ainsi, si A coopère et produit à de faibles niveaux tandis que B fait défaut et produit à des niveaux élevés, le gain est comme indiqué dans la cellule (b) – seuil de rentabilité pour la société A et 7 millions de dollars de bénéfices pour la société B.

Jeu de coordination

En coordination, les joueurs gagnent des gains plus élevés lorsqu’ils choisissent le même plan d’action.

À titre d’exemple, considérons deux géants de la technologie qui décident entre l’introduction d’une nouvelle technologie radicale dans les puces de mémoire qui pourrait leur rapporter des centaines de millions de dollars de bénéfices, ou une version révisée d’une technologie plus ancienne qui leur rapporterait beaucoup moins. Si une seule entreprise décidait d’aller de l’avant avec la nouvelle technologie, le taux d’adoption par les consommateurs serait nettement inférieur et, par conséquent, il gagnerait moins que si les deux entreprises décidaient de la même ligne de conduite. La matrice des gains est présentée ci-dessous (les chiffres représentent les bénéfices en millions de dollars).

Ainsi, si les deux sociétés décident d’introduire la nouvelle technologie, elles gagneraient 600 millions de dollars chacune, tandis que l’introduction d’une version révisée de l’ancienne technologie leur rapporterait 300 millions de dollars chacune, comme indiqué dans la cellule (d). Mais si l’entreprise A décide seule d’introduire la nouvelle technologie, elle ne gagnerait que 150 millions de dollars, même si l’entreprise B gagnerait 0 $ (probablement parce que les consommateurs ne seraient peut-être pas disposés à payer pour sa technologie désormais obsolète). Dans ce cas, il est logique que les deux entreprises travaillent ensemble plutôt que seules.

Jeu de mille-pattes

Il s’agit d’un jeu de forme étendue dans lequel deux joueurs ont alternativement la chance de prendre la plus grande part d’une réserve d’argent qui augmente lentement. Le jeu des mille-pattes est séquentiel puisque les joueurs effectuent leurs mouvements l’un après l’autre plutôt que simultanément; chaque joueur connaît également les stratégies choisies par les joueurs qui ont joué avant eux. Le jeu se termine dès qu’un joueur prend la réserve, avec ce joueur recevant la plus grande partie et l’autre joueur recevant la plus petite partie.

Par exemple, supposons que le joueur A commence et doit décider s’il doit «prendre» ou «passer» la réserve, qui s’élève actuellement à 2 $. S’il prend, alors A et B gagnent 1 $ chacun, mais si A passe, la décision de prendre ou de passer doit maintenant être prise par le joueur B. Si B prend, elle obtient 3 $ (c’est-à-dire la réserve précédente de 2 $ + 1 $) et A obtient 0 $. Mais si B passe, A peut maintenant décider de prendre ou de passer, et ainsi de suite. Si les deux joueurs choisissent toujours de passer, ils reçoivent chacun un gain de 100 $ à la fin de la partie.

Le but du jeu est que si A et B coopèrent tous les deux et continuent de passer jusqu’à la fin du jeu, ils obtiennent le paiement maximum de 100 $ chacun. Mais s’ils se méfient de l’autre joueur et s’attendent à ce qu’il «saisisse» à la première occasion, l’  équilibre de Nash prédit que les joueurs prendront la réclamation la plus basse possible (1 $ dans ce cas). Des études expérimentales ont montré, cependant, que ce comportement «rationnel» (tel que prédit par la théorie des jeux) est rarement présenté dans la vie réelle. Ce n’est pas intuitivement surprenant étant donné la petite taille du paiement initial par rapport au paiement final. Un comportement similaire de la part de sujets expérimentaux a également été présenté dans le dilemme du voyageur.

Le dilemme du voyageur

Ce jeu à somme non nulle, dans lequel les deux joueurs tentent de maximiser leur propre paiement sans égard à l’autre, a été conçu par l’économiste Kaushik Basu en 1994. Par exemple, face au dilemme du voyageur, une compagnie aérienne accepte de payer à deux voyageurs une compensation pour dommages à des articles identiques. Cependant, les deux voyageurs sont tenus d’estimer séparément la valeur de l’article, avec un minimum de 2 $ et un maximum de 100 $. Si les deux écrivent la même valeur, la compagnie aérienne remboursera à chacun d’eux ce montant. Mais si les valeurs diffèrent, la compagnie aérienne leur paiera la valeur la plus basse, avec un bonus de 2 $ pour le voyageur qui a noté cette valeur inférieure et une pénalité de 2 $ pour le voyageur qui a noté la valeur la plus élevée.

Le niveau d’équilibre de Nash, basé sur l’ induction rétrograde, est de 2 $ dans ce scénario. Mais comme dans le jeu des mille-pattes, les expériences en laboratoire démontrent systématiquement que la plupart des participants, naïvement ou non, choisissent un nombre bien supérieur à 2 $.

Le dilemme du voyageur peut être appliqué pour analyser une variété de situations de la vie réelle. Le processus d’induction à rebours, par exemple, peut aider à expliquer comment deux entreprises engagées dans une concurrence acharnée peuvent régulièrement faire baisser les prix des produits dans le but de gagner des parts de marché, ce qui peut les amener à subir des pertes de plus en plus importantes dans le processus.

Bataille des sexes

Il s’agit d’une autre forme du jeu de coordination décrit plus haut, mais avec quelques asymétries de gain. Il s’agit essentiellement d’un couple qui essaie de coordonner sa soirée. Alors qu’ils avaient accepté de se rencontrer soit au jeu de balle (la préférence de l’homme) soit à un jeu (la préférence de la femme), ils ont oublié ce qu’ils ont décidé et, pour aggraver le problème, ne peuvent pas communiquer entre eux. Où devraient-ils aller? La matrice des gains est présentée ci-dessous avec les chiffres dans les cellules représentant le degré relatif de plaisir de l’événement pour la femme et l’homme, respectivement. Par exemple, la cellule (a) représente le gain (en termes de niveau de plaisir) pour la femme et l’homme à la pièce (elle l’apprécie beaucoup plus que lui). La cellule (d) est la récompense si les deux parviennent au jeu de balle (il l’apprécie plus qu’elle ne le fait). La cellule (c) représente le mécontentement si les deux vont non seulement au mauvais endroit, mais aussi à l’événement qu’ils apprécient le moins – la femme au jeu de balle et l’homme au jeu.

Jeu de dictateur

Il s’agit d’un jeu simple dans lequel le joueur A doit décider comment partager un prix en espèces avec le joueur B, qui n’a aucune influence sur la décision du joueur A. Bien qu’il ne s’agisse pas d’une stratégie de théorie des jeux en soi, elle fournit des informations intéressantes sur le comportement des gens. Les expériences révèlent qu’environ 50% gardent tout l’argent pour eux-mêmes, 5% le partagent également et les 45% restants donnent à l’autre participant une part plus petite. Le jeu du dictateur est étroitement lié au jeu de l’ultimatum, dans lequel le joueur A reçoit une somme d’argent fixe, dont une partie doit être donnée au joueur B, qui peut accepter ou refuser le montant donné. Le hic, c’est que si le deuxième joueur rejette le montant offert, A et B n’obtiennent rien. Les jeux du dictateur et de l’ultimatum contiennent des leçons importantes sur des questions telles que les dons de bienfaisance et la philanthropie.

Guerre de paix

Il s’agit d’une variante du dilemme du prisonnier dans lequel les décisions «coopérer ou faire défaut» sont remplacées par «paix ou guerre». Une analogie pourrait être deux entreprises guerre des prix réduirait considérablement les gains (cellule d). Cependant, si A s’engage dans des baisses de prix (c’est-à-dire une «guerre») mais pas B, A aurait un gain de 4 plus élevé car il pourrait être en mesure de conquérir une part de marché substantielle, et ce volume plus élevé compenserait la baisse des prix des produits.

Le dilemme du bénévolat

Dans le dilemme d’un volontaire, quelqu’un doit entreprendre une corvée ou un travail pour le bien commun. Le pire résultat possible est atteint si personne ne se porte volontaire. Par exemple, prenons une entreprise où la fraude comptable est endémique mais où la direction n’en est pas consciente. Certains employés débutants du service comptable sont au courant de la fraude, mais hésitent à en informer la direction, car cela entraînerait le licenciement des employés impliqués dans la fraude et probablement des poursuites.

Être étiqueté comme dénonciateur  peut également avoir des répercussions sur toute la ligne. Mais si personne ne se porte volontaire, la fraude à grande échelle peut entraîner la faillite éventuelle de l’entreprise et la perte d’emplois pour tout le monde.

Questions fréquemment posées

Quels sont les «jeux» joués en théorie des jeux?

C’est ce qu’on appelle la théorie des jeux car la théorie essaie de comprendre les actions stratégiques de deux ou plusieurs «joueurs» dans une situation donnée contenant des règles et des résultats établis. Bien qu’utilisée dans un certain nombre de disciplines, la théorie des jeux est surtout utilisée comme un outil dans l’étude des affaires et de l’économie. Les «jeux» peuvent donc impliquer comment deux entreprises concurrentes réagiront aux baisses de prix de l’autre, si une entreprise devait en acquérir une autre, ou comment les négociants en bourse pourraient réagir aux variations de prix. En termes théoriques, ces  jeux peuvent être classés  comme similaires aux dilemmes du prisonnier, au jeu du dictateur, au faucon et à la colombe et à la bataille des sexes, parmi plusieurs autres variantes.

Que nous apprend le dilemme du prisonnier?

Le dilemme du prisonnier montre qu’une simple coopération n’est pas toujours dans son intérêt. En fait, lors de l’achat d’un article coûteux comme une voiture, la négociation est la ligne de conduite privilégiée du point de vue des consommateurs. Dans le cas contraire, le concessionnaire automobile peut adopter une politique d’inflexibilité dans les négociations de prix, maximisant ses profits mais conduisant les consommateurs à surpayer leurs véhicules. Comprendre les avantages relatifs de la coopération par rapport à la défection peut vous inciter à vous engager dans des négociations de prix importantes   avant de faire un gros achat.

Qu’est-ce qu’un équilibre de Nash en théorie des jeux?

L’équilibre de Nash en théorie des jeux est une situation dans laquelle un joueur continuera avec la stratégie choisie, n’ayant aucune incitation à s’en écarter, après avoir pris en compte la stratégie de l’adversaire.

Comment les entreprises peuvent-elles utiliser la théorie des jeux alors qu’elles se font concurrence?

La concurrence de Cournot, par exemple, est un modèle économique décrivant une structure industrielle dans laquelle des entreprises rivales offrant un produit identique se font concurrence sur la quantité de production qu’elles produisent, indépendamment et en même temps. C’est en fait un jeu de dilemme du prisonnier.

La ligne de fond

La théorie des jeux peut être utilisée très efficacement comme un outil de prise de décision, que ce soit dans un contexte contradictoire, professionnel ou personnel.