零和对策
书籍:西方经济学大辞典
出处:按学科分类—经济 经济科学出版社《西方经济学大辞典》第88页(844字)
在有些对策中,对策双方形成完全的冲突,一个对策者的所得就是另一对策者的所失,反之亦然,这就是零和对策。
例如,在抛硬币的例子中,局中人P和Q同时各抛一硬币,硬币或者正面朝上,或背面朝上。如果两枚硬币落下后都是正面朝上,或背面朝上,则P给Q一美元,否则Q给P一美元。
零和对策通常可用2维的赢得矩阵来表示。
因为一方P之得即为另一方Q之失,所以不必是2个数的数组,只写P或Q的赢得即可。
下面的赢得矩阵B表示,P有m种纯策略抉择,Q有n种纯策略抉择(不由随机试验决定取舍的策略称纯策略)。如果P取第i种策略而Q取第j种策略进行一局对策,则P的赢得为bij,而Q的赢得为-bij。
Q1 Q2 … Qn
P1 b11 b12 … b1n
P2 b21 b22 … b2n
·B=···
●●●●
●●●●
Pm bm1 bm2 … bmn
可见,零和对策可以由赢得矩阵表示。
为了使对方不知道自己将采取什么策略,每个人都不会固定采取某种纯策略,而是各采取一种所谓的混合策略。
对P来说是P=(p1,…pm),即以概率pi采取策略pi,这里p1,p2…pm≥0,p1+…+pm=1。如果p5=0.17,就是表示P将随机地按照17%的几率采用他的第5个纯策略。
对于Q来说,则有q=(q1,…qn),即以概率qi采用策略Qi。