《表3 囚徒困境支付矩阵：博弈环境下合作达成的策略选择》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《博弈环境下合作达成的策略选择》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

注：1．囚徒A的支付函数在前面。2.2R>S+T>2P，坦白诱惑T(Temptation）单独坦白成功赢得为0，抵赖报酬R(Reward）共同抵赖赢得为-1年，坦白惩罚P(Punishment）共同坦白赢得为-8年，受骗支付S(Suckers）被对方坦白赢得为-10。

如表3囚徒困境的支付矩阵，在囚徒B坦白的情况下，囚徒A的最优策略是坦白，只有这样才能不被对方出卖，如果抵赖将会被判刑10年，坦白比抵赖占优；在囚徒B抵赖的情况下，囚徒A的最优策略也是坦白，这样自己就可以即可获释出狱了，如果抵赖将会被判刑8年，坦白比抵赖占优。总之，无论囚徒B供认与否，囚徒A的占优策略是选择“坦白”，同理，囚徒B的占优策略也是选择“坦白”。无论对方是否选择“坦白”，自己选择“坦白”的结果要优于选择“抵赖”的结果，最好的结果是（坦白，坦白），最终形成“囚徒困境”的中纳什均衡。

图表编号	XD00157789600 严禁用于非法目的
绘制时间	2020.06.20
作者	傅晓岩
绘制单位	中央财经大学政府管理学院
更多格式	高清、无水印（增值服务）