首页 > 代码库 > 两人零和博弈的纳什均衡

两人零和博弈的纳什均衡

纳什均衡简单的理解:在这种策略下,任何一位玩家都不愿意单方面的改变自己的策略。

本系列讨论:如何用代码计算两人零和博弈的纳什均衡

例如这样一个赌局

规则:两人各自亮出硬币的一面。如果两人都是正面,那么A给B3元,如果两人都是反面,A给B1元,剩下的情况B给A2元。

这个赌局看似公平,但其实非也。

分析:假设A以p1、p2的概率出正面、反面。

当B出正面时,A的收益为:w1=-3元*p1+2元*p2

当B出反面时,A的收益为:w2=2元*p1-1元*p2

令w1=w2

得p1=3/8,w1=w2=1/8

可见,A可以通过合理的策略获得优势。

当然,我们也可以用代码来解决问题。

两人零和博弈的纳什均衡