其他分享
首页 > 其他分享> > 机器学习02-----线性模型

机器学习02-----线性模型

作者:互联网

一、基本形式
给定d个属性的描述x = {x1;x2;…xd},其中xi是x在第i个属性上的取值,线性模型试图学得一个通过属性的线性组合来进行预测函数,如下:
在这里插入图片描述
一般的向量形式:
在这里插入图片描述

二、线性回归
在这里插入图片描述

线性回归试图学得:
在这里插入图片描述
如何确定w和b,关键在于如何衡量f(x)和 y之间的差别。均方误差是回归任务中最常用的性能度量。我们可以试图让均方误差最小化。即如下:
在这里插入图片描述
相当于最小化预测值和真实标签之间差的平方。均方误差有非常好的集合意义,他对应常用的欧几里得距离,也就是“欧氏距离”。

再令导数为0,得到最优解为:
在这里插入图片描述
在这里插入图片描述
求解过程推导为:
在这里插入图片描述
上述过程也可以使用矩阵的形式进行计算:
在这里插入图片描述

当XTX(T为上标,代表矩阵的转置)为满秩矩阵或正定矩阵。导数为0求解可得:
在这里插入图片描述
在这里插入图片描述
最终学到的多元线性模型为:
在这里插入图片描述
然而在现实生活中会遇到大量的变量(XTX往往不是满秩矩阵),其数目甚至超过样例数,导致X的列数多于行数。这样就会求解出多个w最解,他们都可以是均方误差最小化。选择哪一个作输出则有学习算法的归纳偏好决定。最常见的做法就是引入正则项。

我们将线性模型简写为:
在这里插入图片描述

假设认为示例所对应的输出标记是在指数尺度上变化的,那就可以将输出标记的对数作为线性模型逼近的目标,即如下:
在这里插入图片描述
在形式上仍然是线性回归,但是实质已是在求取输入空间到输出空间的非线性函数映射,这里的对数起到将线性回归模型的预测值于真实标记联系起来的作用。如下图:
在这里插入图片描述

更一般的,考虑单调可微函数g(·)如下:
其中函数g(·)称为”联系函数“,显然,对数线性回归是广义线性模型在g(·)= ln(·)时的特解
在这里插入图片描述

三、对数几率回归
线性模型进行分类任务,只需要找一个单调可微的函数将分类任务的真是标记y与线性模型的预测值联系起来。考虑而分类问题,预测值为{0,1},预测值为实值,最理想的是“单位阶跃函数”
在这里插入图片描述
若预测值大于0就为正例,小于0为反例,等于可以任意判别,如下图:
在这里插入图片描述

由上图可知,单位阶跃函数不连续,得需要找个代替函数----对数几率函数
在这里插入图片描述
代入可得:
在这里插入图片描述
可化为:
在这里插入图片描述

实际上是用线性模型的预测结果去逼近真实标记的对数几率,对应的模型称为“对数几率回归”,他是一种分类算法。他有很多的优点:

重新规划记录内容(精简)

一、线性模型
在这里插入图片描述
二、线性回归

在这里插入图片描述
在这里插入图片描述
三、多元线性回归
在这里插入图片描述

在这里插入图片描述

四、对数线性回归
在这里插入图片描述
在这里插入图片描述

五、对数几率回归
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
六、线性判别分析
在这里插入图片描述
在这里插入图片描述

PS:这些只是自己的记录,就比较的随意,见谅!!!

如有错误,欢迎指正!!!

参考

标签:02,函数,回归,-----,线性,对数,模型,几率
来源: https://blog.csdn.net/qq_44761250/article/details/115271916