Le dilemme du prisonnier
Quel est le dilemme du prisonnier?
Le dilemme du prisonnier est un paradoxe dans l’ analyse des décisions dans lequel deux individus agissant dans leur propre intérêt ne produisent pas le résultat optimal. Le dilemme typique du détenu est mis en place de telle manière que les deux parties choisissent de se protéger aux dépens de l’autre participant. En conséquence, les deux participants se trouvent dans un état pire que s’ils avaient coopéré l’un avec l’autre dans le processus de prise de décision. Le dilemme du prisonnier est l’un des concepts les plus connus de la théorie des jeux moderne.
Points clés à retenir
- Le dilemme d’un prisonnier est une situation où les décideurs individuels sont toujours incités à choisir d’une manière qui crée un résultat moins qu’optimal pour les individus en tant que groupe.
- Les dilemmes du prisonnier surviennent dans de nombreux aspects de l’économie.
- Les gens ont développé de nombreuses méthodes pour surmonter les dilemmes des prisonniers afin de choisir de meilleurs résultats collectifs malgré des incitations individuelles apparemment défavorables.
Comprendre le dilemme du prisonnier
Le dilemme du prisonnier présente une situation où deux parties, séparées et incapables de communiquer, doivent chacune choisir entre coopérer ou non. La récompense la plus élevée pour chaque partie se produit lorsque les deux parties choisissent de coopérer.
Le dilemme classique du prisonnier est le suivant: deux membres d’un gang de voleurs de banque, Dave et Henry, ont été arrêtés et sont interrogés dans des pièces séparées. Les autorités n’ont pas d’autres témoins et ne peuvent prouver les arguments qu’ils portent si elles parviennent à convaincre au moins un des voleurs de trahir son complice et de témoigner du crime. Chaque braqueur de banque est confronté au choix de coopérer avec son complice et de garder le silence ou de se retirer du gang et de témoigner pour les poursuites. S’ils coopèrent tous les deux et gardent le silence, alors les autorités ne pourront les condamner que pour une accusation moindre de flânerie, ce qui signifiera un an de prison chacun (1 an pour Dave + 1 an pour Henry = 2 ans de prison totale temps). Si l’un témoigne et que l’autre ne le fait pas, alors celui qui témoigne sera libre et l’autre aura trois ans (0 an pour celui qui fait défaut + 3 pour celui qui a été condamné = 3 ans au total). Cependant, si les deux témoignent l’un contre l’autre, chacun sera condamné à deux ans de prison pour avoir été en partie responsable du vol (2 ans pour Dave + 2 ans pour Henry = 4 ans de prison totale).
Dans ce cas, chaque voleur a toujours une incitation à faire défection, quel que soit le choix de l’autre. Du point de vue de Dave, si Henry reste silencieux, alors Dave peut soit coopérer avec Henry et faire un an de prison, soit faire défection et être libéré. De toute évidence, il ferait mieux de trahir Henry et le reste du gang dans ce cas. D’autre part, si Henry fait défaut et témoigne contre Dave, alors le choix de Dave devient soit de garder le silence et de faire trois ans, soit de parler et de faire deux ans de prison. Encore une fois, de toute évidence, il préférerait faire les deux ans sur trois.
Dans les deux cas, que Henry coopère avec Dave ou qu’il y ait des vices à la poursuite, Dave sera mieux si lui-même fait des vices et témoigne. Maintenant, puisque Henry est confronté exactement au même ensemble de choix, il sera également toujours mieux de faire défection. Le paradoxe du dilemme du prisonnier est le suivant: les deux voleurs peuvent minimiser la durée totale de la prison que les deux d’entre eux ne feront que s’ils coopèrent tous les deux (2 ans au total), mais les incitations auxquelles ils sont confrontés chacun séparément les motiveront toujours chacun. faire défection et finir par faire la peine d’emprisonnement totale maximale entre les deux (4 ans au total).
Exemples du dilemme du prisonnier
L’économie regorge d’exemples de dilemmes de prisonniers qui peuvent avoir des résultats bénéfiques ou nuisibles à l’économie et à la société dans son ensemble. Le fil conducteur est les situations où les incitations auxquelles est confronté chaque décideur individuel qui choisit les inciteraient chacun à se comporter d’une manière qui les aggraverait tous collectivement, tout en évitant individuellement les choix qui les rendraient tous collectivement plus choisir en quelque sorte en coopération.
La tragédie des biens communs en est un exemple. Il peut être dans l’intérêt collectif de chacun de conserver et de réinvestir dans la propagation d’une ressource naturelle commune afin de pouvoir continuer à la consommer, mais chaque individu a toujours intérêt à consommer le plus possible le plus rapidement possible, ce qui puis épuise la ressource. Trouver un moyen de coopérer améliorerait clairement la situation de tout le monde ici.
D’un autre côté, le comportement des cartels peut également être considéré comme un dilemme du prisonnier. Tous les membres d’un cartel peuvent s’enrichir collectivement en limitant la production pour maintenir le prix que chacun reçoit suffisamment élevé pour capter les rentes économiques des consommateurs, mais chaque membre du cartel est individuellement incité à tromper le cartel et à augmenter la production pour capter également les rentes loin de les autres membres du cartel. En termes de bien-être de la société dans laquelle le cartel opère, ceci est un exemple de la façon dont le dilemme d’un prisonnier qui démolit le cartel peut parfois améliorer la situation de la société dans son ensemble.
Échapper au dilemme du prisonnier
Au fil du temps, les gens ont élaboré une variété de solutions aux dilemmes des détenus afin de surmonter les incitations individuelles en faveur du bien commun.
Premièrement, dans le monde réel, la plupart des interactions économiques et humaines se répètent plus d’une fois. Un vrai dilemme de prisonnier n’est généralement joué qu’une seule fois ou bien il est classé comme un dilemme itéré du prisonnier. Dans le dilemme d’un prisonnier itéré, les joueurs peuvent choisir des stratégies qui récompensent la coopération ou punissent la défection au fil du temps. En interagissant à plusieurs reprises avec les mêmes individus, nous pouvons même délibérément passer du dilemme d’un prisonnier unique au dilemme d’un prisonnier répété.
Deuxièmement, les gens ont développé des stratégies institutionnelles formelles pour modifier les incitations auxquelles les décideurs individuels sont confrontés. L’action collective visant à imposer un comportement coopératif par le biais de la réputation, des règles, des lois, de la prise de décision démocratique ou collective et des punitions sociales explicites pour les défections transforme de nombreux dilemmes de prisonniers en résultats coopératifs plus bénéfiques collectivement.
Enfin, certaines personnes et certains groupes de personnes ont développé au fil du temps des préjugés psychologiques et comportementaux tels qu’une plus grande confiance les uns dans les autres, une orientation future à long terme dans des interactions répétées et des inclinations vers la réciprocité positive des comportements coopératifs ou la réciprocité négative des comportements défectueux. Ces tendances peuvent évoluer à travers une sorte de sélection naturelle au sein d’une société au fil du temps, ou une sélection de groupe dans différentes sociétés concurrentes. En effet, ils amènent des groupes d’individus à choisir «de manière irrationnelle» les résultats qui sont en fait les plus bénéfiques pour tous ensemble.
Ensemble, ces trois facteurs (les dilemmes répétés du prisonnier, les institutions formelles qui résolvent les dilemmes du prisonnier et les préjugés comportementaux qui sapent le choix individuel «rationnel» dans les dilemmes du prisonnier) aident à résoudre les nombreux dilemmes des détenus auxquels nous serions tous confrontés autrement.