其他分享
首页 > 其他分享> > 第九章 矩阵博弈

第九章 矩阵博弈

作者:互联网

1. 知识储备

1.1 零和博弈(zero-sum game)

1.2 矩阵博弈


在这里插入图片描述

2. 正文【矩阵博弈】

在本章中,我们仅讨论有限策略集的两人零和博弈。假设 S 1 = { s 11 , s 12 , … , s 1 m } , S 2 = { s 21 , s 22 , ⋅ ⋅ ⋅ , s 2 n } S_1=\{s_{11},s_{12}, …, s_{1m}\} ,S_2=\{s_{21}, s_{22},···,s_{2n}\} S1​={s11​,s12​,…,s1m​},S2​={s21​,s22​,⋅⋅⋅,s2n​}。

在不至于混淆的情形下,我们从现在起使用符号 S 1 = 1 , 2 , ⋅ ⋅ ⋅ , m , S 2 = 1 , 2 , ⋅ ⋅ ⋅ , n S_1= {1, 2, ···,m}, S_2={1, 2, ···, n} S1​=1,2,⋅⋅⋅,m,S2​=1,2,⋅⋅⋅,n [注意,不要将这里的n与本书其他地方的n(代表参与博弈的人数)相混淆]。

由于一个参与人的收益正好是另外一人收益的相反数,这些博弈可用含有 m 行和 n 列的矩阵A表示,其中 a i j = u 1 ( i , j ) , ∀ i ∈ S 1 , ∀ j ∈ S 2 a_{ij}=u_1 (i, j), \forall i \in S_1,\forall j \in S_2 aij​=u1​(i,j),∀i∈S1​,∀j∈S2​. 这个数是当参与人1 (行参与人)选择策略 i i i 且参与人2 (列参与人)选择策略 j j j 时的收益,此时参与人 2的收益为 − a i j -a_{ij} −aij​;。因此,这样的博弈也称为矩阵博弈。

2.1 矩阵博弈案例

2.1.1 硬币问题

硬币问题,参与人各抛一枚硬币,然后进行配对,配对成功(同为正或同为反)参与人 1 得一块钱,反之,参与人 2 得一块钱
在这里插入图片描述

2.1.2 石头剪刀布问题

在这里插入图片描述

2.1.3 产品预测问题

在这里插入图片描述

2.1.4 零和博弈的问题

收益之和为常数的一个博弈

2.2 矩阵博弈中的纯策略

2.2.1 介绍

在这里插入图片描述
类似地,当列参与入选择纯策略 j j j 时,他保证他的收益等于
在这里插入图片描述
也就是说,列参与人保证自己的损失不大与
在这里插入图片描述
于是,列参与人的最优策略是使得这个损失最小:
在这里插入图片描述
这称为最小最大化(mirunaximization)列参与人的这种策略称为他的安全策略(secu­rity strategy)。

2.2.2 相关定义


在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.2.3 求解纯策略的值

在这里插入图片描述
在这里插入图片描述

参考

《博弈论与机制设计》中国人民大学出版社,经济科学译丛

标签:博弈,策略,第九章,参与,矩阵,2.1,收益
来源: https://blog.csdn.net/qq_40926887/article/details/121201702