其他分享
首页 > 其他分享> > 李宏毅机器学习笔记:4.概率分类模型

李宏毅机器学习笔记:4.概率分类模型

作者:互联网

# 2021.09.18 点赞过1 明日更新下一P
# 内容:P10,P11
主要参考:https://blog.csdn.net/oldmao_2001/article/details/90314458
高斯分布:https://zhuanlan.zhihu.com/p/262125747

文章目录

P10: 概率分类模型

10.1 线性回归模型短板

在这里插入图片描述
右图我们得到的是紫的回归线,很明显 不是最理想的绿色

在这里插入图片描述
损失函数是输出和标记(label)不同的次数之和,这个函数是无法微分的。学过的梯度下降无法解决这个问题,解决方案有:感知机、支持向量机,但今天会用概率的方式解决这个问题。

10.2 贝叶斯

大名鼎鼎的贝叶斯是啥?很简单。
在这里插入图片描述
贝叶斯:拿到一个球是绿球,这个球是C1类拿出的概率是:在这里插入图片描述

其中,全概率公式:
.
在这里插入图片描述
说人话就是,取出x的概率(比如绿球的概率)=C1箱中拿个球是绿 x x x球 x 选C1箱的概率 + C2箱中拿个球 x x x是绿球 x 选C2箱的概率

*注 运算符号为黄

10.3 高斯分布

正态分布数学推导过程: https://zhuanlan.zhihu.com/p/24437232

引题

如果你抓了一把沙子,然后将它撒在桌子上,那么,沙子会均匀的铺在桌子上么,不会,沙子会堆成一个小堆,中心沙子最多,离中心越远沙子越少。

如果一个地区的平均工资是6000元,那么,收入2000元和10000元的人将是少数,大部分人的工资会在6000元左右浮动。

我们通常发现,以上问题都有很规律的分布,就是中间概率大,极端概率小的问题。

单变量高斯分布

在这里插入图片描述

可以说 方差 σ \sigma σ 控制着高斯分布的“瘦”和“胖”。也很容易理解,因为方差主要看离散程度,如果方差越小,说明越集中,那么中间统计数量就越多,概率就越大,图形就越高;如果方差越大,说明,数据越离散,极端情况的数据就相对于更多,分布就越扁。

方差公式

σ 2 = ( 1 / m ) ∑ i = 1 m ( x i − μ ) 2 \sigma^2=(1/m)\sum_{i=1}^m(x^i-\mu)^2 σ2=(1/m)∑i=1m​(xi−μ)2
.
这里, x i x^i xi是数据集中的单个值,m是数据的总数。

左图的形状与右图完全相同,只是中心移动到了3。现在最大的密度是3。也很容易理解, μ \mu μ是个均值概念,也就是平均值,他的值就应该是分布最多的地方,也是正态分布轴的位置。

方差公式

μ = ( 1 / m ) ∑ i = 1 m x i \mu=(1/m)\sum_{i=1}^mx^i μ=(1/m)∑i=1m​xi
.
这里, x i x^i xi是数据集中的单个值,m是数据的总数。

【多元高斯分布】

在这里插入图片描述

这里面有三个参数:

我们也就是 知道一个数据x的n位特征和抽样统计分布的 μ , Σ \mu,\Sigma μ,Σ, 我们能求出来,这个数据抽样出来的概率

10.4 应用过程

以李宏毅老师,宝可梦二维数据来演示二分类过程,数据应用计算过程

已知:我们从样本中抽了140只宝可梦,水系宝可梦79只,一般系宝可梦61只

:如何知道一个宝可梦(例如一只海龟)属于水系的概率是多少?即 P(x|C1),如果是2分类,大于0.5,那么就归于class1(水系)

【思路】

在这里插入图片描述
我们如果知道P(C1),P(C2),P(x|C1),P(x|C2),四个概率 就可解求得

P(C1) = 79/(79+61) = 0.56
P(C2) = 61/(79+61) = 0.44

【杨哥解析】

  • 首先这140只宝可梦是抽出来的,满足高斯分布
  • 如图,取样可能满足多个高斯分布
    在这里插入图片描述

如何选择?

我们选择概概率最大的,也就是最大似然高斯分布( μ ∗ , Σ ∗ \mu^*,\Sigma^* μ∗,Σ∗)

正规求法:
在这里插入图片描述

直接结果法,求C1的分布:

在这里插入图片描述

同理,求C2的。得到一下结果

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

10.5 模型改进

在这里插入图片描述

正规求法
在这里插入图片描述

偷懒求法:
在这里插入图片描述

标签:概率,方差,李宏毅,模型,笔记,mu,C2,C1,高斯分布
来源: https://blog.csdn.net/wistonty11/article/details/120365719