18 avril 2021 7:16

Le dilemme du prisonnier itéré

Quel est le dilemme du prisonnier itéré?

Le dilemme itéré du prisonnier est une extension de la forme générale, sauf que le jeu est joué à plusieurs reprises par les mêmes participants. Le dilemme d’un prisonnier itéré diffère du concept original du dilemme d’un prisonnier parce que les participants peuvent en apprendre davantage sur les tendances comportementales de leur homologue.

Le dilemme répété du prisonnier a parfois été appelé le jeu de la guerre de la paix.

Comprendre le dilemme du prisonnier itéré

Puisque le jeu est répété, un individu peut formuler une stratégie qui ne suit pas la convention logique régulière d’un tour isolé. Tit for tat est une stratégie de dilemme répétée courante pour les prisonniers.

Le jeu de dilemme itéré du prisonnier est fondamental pour de nombreuses théories de la coopération et de la confiance humaines. En partant de l’hypothèse que le jeu peut modéliser des transactions entre deux personnes nécessitant de la confiance, le comportement coopératif des populations peut être modélisé par une version itérée et multi-joueurs du jeu.

La théorie derrière le jeu a captivé de nombreux chercheurs au fil des ans. Plus récemment, des chercheurs en conception organisationnelle ont utilisé le jeu pour modéliser des stratégies d’entreprise. Le dilemme du prisonnier est également désormais courant pour les théories du jeu devenant populaires auprès des stratèges d’investissement. La mondialisation et le commerce intégré ont encore stimulé la demande de modèles financiers et opérationnels capables de décrire les problèmes géopolitiques.

Exemple du jeu du dilemme du prisonnier itéré

Par exemple, vous et un collègue êtes en prison et soupçonnés d’avoir commis un crime. Vous êtes isolé l’un de l’autre et ne savez pas comment l’autre répondra au questionnement. La police vous invite tous les deux à impliquer l’autre dans le crime (défaut). Ce qui se passe dépend de ce que vous faites tous les deux, mais aucun de vous ne sait comment l’autre va réagir.

Si votre collègue vous trahit (cède à la tentation de faire défection) pendant que vous restez silencieux, alors vous recevez la plus longue peine de prison pendant que votre collègue se libère (et vice versa). Si vous choisissez tous les deux de coopérer l’un avec l’autre (pas la police) en gardant le silence, les preuves sont insuffisantes pour vous condamner tous les deux, de sorte que vous êtes tous les deux condamnés à une peine légère pour un crime moindre. Si vous décidez tous les deux de faire défection, vous vous êtes condamnés l’un l’autre à des peines légèrement réduites mais toujours lourdes.

Le gain dans ce jeu est une réduction des peines d’emprisonnement de très bonnes, assez bonnes, assez mauvaises ou très mauvaises, qui se traduit par un système de points comme suit:

Le jeu est joué de manière itérative pendant un certain nombre de tours jusqu’à ce qu’il soit terminé (comme si vous étiez interrogé à plusieurs reprises pour des crimes séparés). Les scores de chaque tour sont accumulés, l’objectif est donc d’optimiser le score de points avant d’atteindre la fin de la partie. La fin de la partie est déterminée aléatoirement entre 1 et 100 tours. À la fin du jeu, les scores sont traduits en pourcentages des meilleurs scores possibles.