《表3 囚徒困境支付矩阵:博弈环境下合作达成的策略选择》

《表3 囚徒困境支付矩阵:博弈环境下合作达成的策略选择》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《博弈环境下合作达成的策略选择》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:1.囚徒A的支付函数在前面。2.2R>S+T>2P,坦白诱惑T(Temptation)单独坦白成功赢得为0,抵赖报酬R(Reward)共同抵赖赢得为-1年,坦白惩罚P(Punishment)共同坦白赢得为-8年,受骗支付S(Suckers)被对方坦白赢得为-10。

如表3囚徒困境的支付矩阵,在囚徒B坦白的情况下,囚徒A的最优策略是坦白,只有这样才能不被对方出卖,如果抵赖将会被判刑10年,坦白比抵赖占优;在囚徒B抵赖的情况下,囚徒A的最优策略也是坦白,这样自己就可以即可获释出狱了,如果抵赖将会被判刑8年,坦白比抵赖占优。总之,无论囚徒B供认与否,囚徒A的占优策略是选择“坦白”,同理,囚徒B的占优策略也是选择“坦白”。无论对方是否选择“坦白”,自己选择“坦白”的结果要优于选择“抵赖”的结果,最好的结果是(坦白,坦白),最终形成“囚徒困境”的中纳什均衡。