其他分享
首页 > 其他分享> > 贝叶斯例题(四)决策中的收益、损失与效用

贝叶斯例题(四)决策中的收益、损失与效用

作者:互联网

第四章 决策中的收益、损失与效用

例4.1.4

取 θ \theta θ用来表示市场需求量,这是具有随机性的变量。用a来表示购买量,这是人可以确定的行动,此时便有收益函数
Q ( θ , a ) = { 1.1 ∗ 0.9 ∗ a − 0.65 ∗ a 0.9 ∗ a ≤ θ 1.1 ∗ θ − 0.65 ∗ a + ( 0.9 ∗ a − θ ) ∗ 0.3 0.9 ∗ a > θ Q(\theta,a)=\begin{cases}1.1*0.9*a-0.65*a&0.9*a\le\theta\\1.1*\theta-0.65*a+(0.9*a-\theta)*0.3&0.9*a>\theta\end{cases} Q(θ,a)={1.1∗0.9∗a−0.65∗a1.1∗θ−0.65∗a+(0.9∗a−θ)∗0.3​0.9∗a≤θ0.9∗a>θ​
可以化简为
Q ( θ , a ) = { 0.34 a 0.9 a ≤ θ 0.8 θ − 0.38 a θ < 0.9 a Q(\theta,a)=\begin{cases}0.34a&0.9a\le\theta\\0.8\theta-0.38a&\theta<0.9a\end{cases} Q(θ,a)={0.34a0.8θ−0.38a​0.9a≤θθ<0.9a​

例4.3.2

在例4.1.4的基础上,采用 [ 500 , 2000 ] [500,2000] [500,2000]上的均匀分布作为先验分布,求先验期望收益
解:
有先验期望为 π ( θ ) = 1 1500 , 500 ≤ θ ≤ 2000 \pi(\theta)=\frac{1}{1500},500\le\theta\le2000 π(θ)=15001​,500≤θ≤2000
对收益函数求期望,可有
E ( Q ( θ , a ) ∣ θ ) = ∫ 500 0.9 a 0.8 θ − 0.38 a 1 1500 d θ + ∫ 0.9 a 2000 0.34 a 1 1500 d θ = 1 1500 [ − 0.324 a 2 + 870 a − 10000 ] E(Q(\theta,a)|\theta)=\int_{500}^{0.9a}0.8\theta-0.38a\frac{1}{1500}d\theta+\int_{0.9a}^{2000}0.34a\frac{1}{1500}d\theta\\=\frac{1}{1500}[-0.324a^2+870a-10000] E(Q(θ,a)∣θ)=∫5000.9a​0.8θ−0.38a15001​dθ+∫0.9a2000​0.34a15001​dθ=15001​[−0.324a2+870a−10000]
这是一个只与行动有关的式子,因为状态被求期望时积分掉了
可有最优行动是在收益取最大值的时候,即 a = − 870 2 ∗ − 0.324 = 1343 a=\frac{-870}{2*-0.324}=1343 a=2∗−0.324−870​=1343

例4.4.1

有收益矩阵
Q = ( a 1 a 2 a 3 10 6 2 θ 1 3 4 2 θ 2 − 2.7 − 0.8 1 θ 3 ) Q=\left(\begin{array}{cc} a_1&a_2&a_3\\ 10&6&2&\theta_1\\ 3&4&2&\theta_2\\ -2.7&-0.8&1&\theta_3\\ \end{array}\right) Q=⎝⎜⎜⎛​a1​103−2.7​a2​64−0.8​a3​221​θ1​θ2​θ3​​⎠⎟⎟⎞​
求损失矩阵
解:
现改写为损失矩阵,对每一行求最大值,可有
Q ( θ = θ 1 , max ⁡ a ) = 10 Q ( θ = θ 2 , max ⁡ a ) = 4 Q ( θ = θ 3 , max ⁡ a ) = 1 Q(\theta=\theta_1,\max_a)=10\\ Q(\theta=\theta_2,\max_a)=4\\ Q(\theta=\theta_3,\max_a)=1 Q(θ=θ1​,maxa​)=10Q(θ=θ2​,maxa​)=4Q(θ=θ3​,maxa​)=1
可有损失矩阵
L ( θ , a ) = ( a 1 a 2 a 3 0 4 8 θ 1 1 0 2 θ 2 3.7 1.8 0 θ 3 ) L(\theta,a)=\left(\begin{array}{cc} a_1&a_2&a_3\\ 0&4&8&\theta_1\\ 1&0&2&\theta_2\\ 3.7&1.8&0&\theta_3\\ \end{array}\right) L(θ,a)=⎝⎜⎜⎛​a1​013.7​a2​401.8​a3​820​θ1​θ2​θ3​​⎠⎟⎟⎞​

例4.4.4

在例4.4.1的基础上,求悲观准则下根据收益矩阵和损失矩阵的行动
解:
首先对收益矩阵求解
先求出不同行动的最小收益
Q ( min ⁡ θ , a 1 ) = − 2.7 Q ( min ⁡ θ , a 2 ) = − 0.8 Q ( min ⁡ θ , a 3 ) = 1 Q(\min_{\theta},a_1)=-2.7\\ Q(\min_{\theta},a_2)=-0.8\\ Q(\min_{\theta},a_3)=1 Q(minθ​,a1​)=−2.7Q(minθ​,a2​)=−0.8Q(minθ​,a3​)=1
在其中选最大者,可有 Q ( min ⁡ θ , max ⁡ a ) = 1 Q(\min_{\theta},\max_{a})=1 Q(minθ​,maxa​)=1
故选取 a 3 a_3 a3​
同理,针对损失矩阵
先求出不同行动的最大损失
L ( max ⁡ θ , a 1 ) = 3.7 L ( max ⁡ θ , a 2 ) = 4 L ( max ⁡ θ , a 3 ) = 8 L(\max_{\theta},a_1)=3.7\\ L(\max_{\theta},a_2)=4\\ L(\max_{\theta},a_3)=8 L(maxθ​,a1​)=3.7L(maxθ​,a2​)=4L(maxθ​,a3​)=8
在其中选最小者,可有 L ( max ⁡ θ , min ⁡ a ) = 3.7 L(\max_{\theta},\min_{a})=3.7 L(maxθ​,mina​)=3.7
故选取 a 1 a_1 a1​

例4.4.6

在例4.4.1的基础上,有先验概率,求先验期望损失准则下的最优行动

已知先验分布 π ( θ ) = { θ 1 0.2 θ 2 0.7 θ 3 0.1 \pi(\theta)=\begin{cases} \theta_1&0.2\\\theta_2&0.7\\\theta_3&0.1 \end{cases} π(θ)=⎩⎪⎨⎪⎧​θ1​θ2​θ3​​0.20.70.1​
可有损失
L ( θ π ( θ ) , a 1 ) = 0 ∗ 0.2 + 1 ∗ 0.7 + 3.7 ∗ 0.1 = 1.07 L ( θ π ( θ ) , a 2 ) = 4 ∗ 0.2 + 0 ∗ 0.7 + 1.8 ∗ 0.1 = 0.98 L ( θ π ( θ ) , a 3 ) = 8 ∗ 0.2 + 2 ∗ 0.7 + 0 ∗ 0.1 = 3 L(\theta\pi(\theta),a_1)=0*0.2+1*0.7+3.7*0.1=1.07\\ L(\theta\pi(\theta),a_2)=4*0.2+0*0.7+1.8*0.1=0.98\\ L(\theta\pi(\theta),a_3)=8*0.2+2*0.7+0*0.1=3 L(θπ(θ),a1​)=0∗0.2+1∗0.7+3.7∗0.1=1.07L(θπ(θ),a2​)=4∗0.2+0∗0.7+1.8∗0.1=0.98L(θπ(θ),a3​)=8∗0.2+2∗0.7+0∗0.1=3
选其中最小者,可有 L ( θ π ( θ ) , min ⁡ a ) = 0.98 L(\theta\pi(\theta),\min_{a})=0.98 L(θπ(θ),mina​)=0.98
故选择行动 a 2 a_2 a2​
由于行动 a 1 , a 2 a_1,a_2 a1​,a2​的差距不大,小于0.1,故考虑风险,可有
$
V(\theta\pi(\theta),a_1)=0.2*(1.07-0)2+0.7*(1.07-1)2+0.1*(1.07-3.7)^2=0.9241\
V(\theta\pi(\theta),a_2)=0.2*(0.98-0)2+0.7*(0.98-1)2+0.1*(0.98-3.7)^2=2.5636\
V(\theta\pi(\theta),a_3)=0.2*(3-0)2+0.7*(3-1)2+0.1*(3-3.7)^2=6.6
$
可以看到,行动 a 1 a_1 a1​的方差更小,更稳定,风险更低,所以也可以选择

例4.5.1

已有收益函数
Q ( θ , a ) = { 3.5 θ a 1 10 + 3 θ a 2 Q(\theta,a)=\begin{cases} 3.5\theta&a_1\\10+3\theta&a_2 \end{cases} Q(θ,a)={3.5θ10+3θ​a1​a2​​
求损失函数
解:
首先判定大小,令 3.5 θ = 10 + 3 θ 3.5\theta=10+3\theta 3.5θ=10+3θ可有 θ = 20 \theta=20 θ=20
也就是当 θ < 20 \theta<20 θ<20时, a 2 > a 1 a_2>a_1 a2​>a1​,否则, a 1 > a 2 a_1>a_2 a1​>a2​
可有损失函数
L ( θ , a 1 ) = { 10 − 0.5 θ θ ≤ 20 0 θ > 20 L(\theta,a_1)=\begin{cases} 10-0.5\theta&\theta\le20\\ 0&\theta>20 \end{cases} L(θ,a1​)={10−0.5θ0​θ≤20θ>20​
L ( θ , a 2 ) = { 0 θ ≤ 20 0.5 θ − 10 θ > 20 L(\theta,a_2)=\begin{cases} 0&\theta\le20\\ 0.5\theta-10&\theta>20 \end{cases} L(θ,a2​)={00.5θ−10​θ≤20θ>20​

标签:0.9,10,min,0.1,max,贝叶斯,效用,theta,例题
来源: https://blog.csdn.net/qq_40851744/article/details/121705011