第九章 矩阵博弈
作者:互联网
1. 知识储备
1.1 零和博弈(zero-sum game)
- 零和博弈(zero-sum game),又称零和游戏,与非零和博弈相对,是博弈论的一个概念,属非合作博弈。
- 它是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作的可能。
1.2 矩阵博弈
- 两人零和博弈描述了两人严格竞争情形。矩阵博弈(matrix games)是伴随有限策略集的两人零和博弈。
- 最小最大值定理(minimax theorem), 表明每个矩阵博弈都有混合策略纳什均衡。
2. 正文【矩阵博弈】
在本章中,我们仅讨论有限策略集的两人零和博弈。假设 S 1 = { s 11 , s 12 , … , s 1 m } , S 2 = { s 21 , s 22 , ⋅ ⋅ ⋅ , s 2 n } S_1=\{s_{11},s_{12}, …, s_{1m}\} ,S_2=\{s_{21}, s_{22},···,s_{2n}\} S1={s11,s12,…,s1m},S2={s21,s22,⋅⋅⋅,s2n}。
在不至于混淆的情形下,我们从现在起使用符号 S 1 = 1 , 2 , ⋅ ⋅ ⋅ , m , S 2 = 1 , 2 , ⋅ ⋅ ⋅ , n S_1= {1, 2, ···,m}, S_2={1, 2, ···, n} S1=1,2,⋅⋅⋅,m,S2=1,2,⋅⋅⋅,n [注意,不要将这里的n与本书其他地方的n(代表参与博弈的人数)相混淆]。
由于一个参与人的收益正好是另外一人收益的相反数,这些博弈可用含有 m 行和 n 列的矩阵A表示,其中 a i j = u 1 ( i , j ) , ∀ i ∈ S 1 , ∀ j ∈ S 2 a_{ij}=u_1 (i, j), \forall i \in S_1,\forall j \in S_2 aij=u1(i,j),∀i∈S1,∀j∈S2. 这个数是当参与人1 (行参与人)选择策略 i i i 且参与人2 (列参与人)选择策略 j j j 时的收益,此时参与人 2的收益为 − a i j -a_{ij} −aij;。因此,这样的博弈也称为矩阵博弈。
2.1 矩阵博弈案例
2.1.1 硬币问题
硬币问题,参与人各抛一枚硬币,然后进行配对,配对成功(同为正或同为反)参与人 1 得一块钱,反之,参与人 2 得一块钱
2.1.2 石头剪刀布问题
2.1.3 产品预测问题
2.1.4 零和博弈的问题
收益之和为常数的一个博弈
- 零和博弈的一个直接推广就是收益之和为 常数的博弈: < 1 , 2 , S i , S 2 , u 1 , u 2 > <{ 1, 2} ,S_i , S_2 , u_1 , u_2> <1,2,Si,S2,u1,u2> 使得 u 1 ( s 1 , s 2 ) + u 2 ( s 1 , s 2 ) = C u_1 (s_1, s_2 )+u_2(s_1, s_2 )=C u1(s1,s2)+u2(s1,s2)=C, 其中 C 是一个已知常数。
- 给定任何一个收益之和为常数的博弈,我们都可以通过简单变换(比如,将每个参与人的每个收益减去该常数),把它变为一个零和博弈, 从而将其作为零和博弈进行分析。
2.2 矩阵博弈中的纯策略
2.2.1 介绍
类似地,当列参与入选择纯策略
j
j
j 时,他保证他的收益等于
也就是说,列参与人保证自己的损失不大与
于是,列参与人的最优策略是使得这个损失最小:
这称为最小最大化(mirunaximization)。列参与人的这种策略称为他的安全策略(security strategy)。
2.2.2 相关定义
2.2.3 求解纯策略的值
参考
《博弈论与机制设计》中国人民大学出版社,经济科学译丛
标签:博弈,策略,第九章,参与,矩阵,2.1,收益 来源: https://blog.csdn.net/qq_40926887/article/details/121201702