首页 > 其他分享> > 机器学习02-----线性模型

机器学习02-----线性模型

2021-04-01 09:01:40 作者：互联网

一、基本形式
给定d个属性的描述x = {x1;x2;…xd}，其中xi是x在第i个属性上的取值，线性模型试图学得一个通过属性的线性组合来进行预测函数，如下：
在这里插入图片描述
一般的向量形式：

二、线性回归
在这里插入图片描述

线性回归试图学得：
在这里插入图片描述
如何确定w和b，关键在于如何衡量f（x）和 y之间的差别。均方误差是回归任务中最常用的性能度量。我们可以试图让均方误差最小化。即如下：

相当于最小化预测值和真实标签之间差的平方。均方误差有非常好的集合意义，他对应常用的欧几里得距离，也就是“欧氏距离”。

最小二乘法：基于均方误差最小化来进行模型的求解的方法，在线性回归中，最小二乘法就是试图找到一条直线，使所有的样本到直线上的欧氏距离之和最小。
最小二乘“参数估计”：求解w和b使E（w，b）最小化的过程。可分别对w和b求导得到：

求导的推导过程如下：

再令导数为0，得到最优解为：
在这里插入图片描述

求解过程推导为：

上述过程也可以使用矩阵的形式进行计算：

多元线性回归
我们可以类似的利用最小二乘法来对参数进行估计。为了方便讨论，一下引入向量的形式。数据集D表示为一个矩阵X，行前d个元素对应于示例的d个属性值，最后一个元素置为1，如下：

再将标记也写成向量形式，有：

变换过程如下：

对w参数进行求导可得：

求解过程如下；

令上式为0可得到w的最有闭式解。这里做一个简单的讨论：

当XTX（T为上标，代表矩阵的转置）为满秩矩阵或正定矩阵。导数为0求解可得：
在这里插入图片描述

最终学到的多元线性模型为：

然而在现实生活中会遇到大量的变量（XTX往往不是满秩矩阵），其数目甚至超过样例数，导致X的列数多于行数。这样就会求解出多个w最解，他们都可以是均方误差最小化。选择哪一个作输出则有学习算法的归纳偏好决定。最常见的做法就是引入正则项。