其他分享
首页 > 其他分享> > 吴恩达机器学习Coursera-week7

吴恩达机器学习Coursera-week7

作者:互联网

Large Margin Classification

Optimization Objective

此小节主要讲了SVM的cost function是怎么来的。SVM(Support Vector Machine)是一种类似于Logistic Regression的分类算法。Andrew通过Logistic Regression的cost function来引申出了SVM的cost function,如下图:

3959253-bf07d69a524b9f9d.jpg 1.1-cost function
图中,我们用红色曲线来近似地替代Logistic Regression的cost function曲线。当y=1时,我们的cost function记做cost1(z);当y=0时,记做cost0(z)。(注意:z=θTx)
然后我们将这个新的cost function替换原来的cost function,并进行一些转换,具体如下图:
3959253-42a0ccc236c05a34.jpg 1.2-SVM cost function

Large Margin Intuition

这节主要讲了直觉上large margin是怎么回事,主要是decision bounary两边会有margin,如下图:


3959253-e1b2fe6c82e9876a.jpg 2.1-large margin

Mathematics behind large margin classification

此小节主要讲了SVM背后的数学原理。
首先,讲了向量内积(vector inner product)的知识,假设我们有两个向量u和v, 那么它们的inner product就是uTv,从这里也可以看出向量内积是一个实数,我们可以通过如下方式计算向量内积:

3959253-0fedcec1c2fd9128.jpg 3.1-vector inner product

uTv = P · ||u|| = u1v1 + u2v2
其中P是向量v在向量u上投影的长度, ||u||是向量u的长度,这里需要注意P是一个有符号数,当其夹角>90° 且<270°时,P为负。

然后,结合图1.3我们的优化目标,可以看出要想满足我们的优化条件就会使得decision boundary有较大的margin,如下图推导过程:


3959253-55eb79a980050aa0.jpg 3.2-SVM Decision Boundary

上图中有些错误:首先第二个限定条件应该是y(i)=0; 另外,右下角图应该是满足条件P(i)||θ|| >= 1

从图中可以看出为了满足我们的优化目标,即θ的长度越小越好,还要符合限定条件,那么结论就是p越大越好,即当y=1时,p长度越大,||θ||就可以使用相对较小的值来满足p(i)·||θ|| >= 1, 这样就会使得1/2 ||θ||2越小;同样道理y=0也是希望p的长度越大越好。

这里有个问题,就是为啥θ向量一定是垂直于decision boundary的?另外,如果不是线性可分的,那么如何使得其限定条件能满足呢?比如在y(i)=1的情况下,如果p(i)<0,这种情况就无法满足p(i)·||θ|| >=1

第二个问题在接下来的Kernels章节得到了回答,即如果是非线性可分的情况下,我们需要引入polynomial function来使得decision bounary变为曲线的,而在接下来的章节,我们会发现,最终使用的是新引入的feature,而非直接将原有的feature相乘。具体参考后面的章节。

Kernels

Kernels I

首先,Andrew引入了一个非线性问题的示例,使用之前Linear Regression的知识,我们可以想象出需要引入polynomial function来解决此类问题。实际上我们可以理解为引入了新的Feature(比如将x1*x2作为一个新的feature f1),但是,实际上我们是否有更好的引入新的feature的方法呢?原因之一就是使用polynomial方法的计算量会非常大,而且这个变量本身的含义也不是很清楚,因此这就是我们接下来要引入kernel的原因。下图展示了如何引入新的feature:


3959253-4957094bd3881e61.jpg 4.1-kernel

由上图我们可得出如下的结论:


3959253-c2d8921156d61ee4.jpg 4.4-kernels and similarity

即如果两点距离很大,那么这个新的feature f就会接近于0,如果距离很小,f就会接近于1,而

标签:function,kernel,吴恩达,SVM,Coursera,feature,cost,我们,week7
来源: https://blog.csdn.net/weixin_33691598/article/details/87229790