其他分享
首页 > 其他分享> > 吴恩达 机器学习知识点笔记

吴恩达 机器学习知识点笔记

作者:互联网

1-3监督学习:

        回归问题(样例):

监督学习是指我们给算法一个数据集,其中包含了正确答案,也就是说我们给它一个房价数据集,在这个数据集中的每个样本,我们都会给出正确的价格,即这个房子实际卖价,算法的目的给出更多的正确答案,例如为你朋友想要卖掉的这所房子给出估价,它也被成为回归问题(Regression)

这里的回归问题指的是我们想要预测连续的数值输出,跟就这个题目,也就是价格,技术上来说价格可以被很精确的表出,比如精确到分,因此价格实际上是一个离散值,但通常我们认为房价是一个实数,标量或是连续值。回归这个术语是指我们设法预测连续值的属性

        分类(样例):

 在分类问题中,有时也可以有两个以上的可能的输出值,在实际例子中就是可能有三种类型的乳腺癌,因此我们可能要想尽办法预测离散值0 ,1, 2, 3.其中0是良性的,1是指第一种类型的癌症,以此类推,这也是一个分类问题,因为这是一组离散的输出值,对应没有癌症和癌症1癌症2癌症3,在分类问题中,有另一种方法来绘制这些数据,用一组不同的符号来绘制这组数据,在这个样例中,如果肿瘤的大小是我用来,预测恶性和良性的特征 ,用O来代表良性,X代表恶性

在这个例子中我们只用了一个特征值或者说属性,即肿瘤的大小,来进行预测肿瘤是恶性的还是良性的,在其他的机器学习中,我们会有多个特征,多个属性,列子如下

 

在给定的数据集上,学习算法能做的,就是在数据上画出一条直线,设法将良性瘤和恶性瘤分开,学习算法可能会这样画出一道线,来判断你朋友的肿瘤类型,在这个例子中有了两个特征,年龄和大小,还有其他的特征即肿瘤的厚度,肿瘤细胞大小的活性,肿瘤细胞大小的均称性和其他的特征

 假如我们想要的不是使用三个还是五个特征值,而是想用无穷多的特征,因此我们的学习算法有很多的属性或者特征线索来做预测,问题被提出 1如何在计算机中存储无穷多数量的事物,计算机内存可能会溢出,以支持向量机算法为例,允许计算机处理无穷多的特征,假设我写下无穷长的例表,无限的特征,这种情况可以被解决。

概括(总述)

监督学习我认为可能重在预测,在预测之前,已经有了成功的样例和失败的样例 ,在成功和失败的样例中寻找规律,当给出一个测试样例时,可以给出预测,让预测结果更加的接近正确答案

分类:预测离散值(0或者1)多种情况

回归:房价类似连续值

    Question:    

 正确答案C

1-4无监督学习:

        监督学习样例                                                  无监督学习样例          

 无监督学习没有任何标签,都具有相同的标签或者都没有标签,我们得到一个数据集的时候,我们不知道要拿它来做什么,也不知道每个数据点究竟是什么,我们只知道这是一个数据集,对于给定的数据集,无监督学习可能判定,该数据集博阿寒两个不同的簇,这就是聚类算法,实际上他被用在许多地方。应用聚类算法的例子就是谷歌新闻(如图)

当我们点击新闻时可能会得到新的新闻,比如报道一篇石油泄漏(CNN),在我们观看新闻时,该网站又会推荐给我们一些其他的报道(来自卫报),诸如此类,都是聚类算法的 效果,谷歌所做的去搜索成千上万的新闻,然后自动地将他们分簇,将有关的新闻显示在一起。无监督学习和聚类还有很多的用处因为我们没有将数据集的正确答案给算法,所以这就是无监督学习。

无监督学习或聚类算法在其他邻域也有大量的应用,1它被用来组织大型的计算机集群并试图找出那些机器趋于协同工作,把趋于协同的机器放在一起,可以让你的数据中心更高效的工作2社交网络分析3市场划分4天文数据分析

 吴恩达说:“使用Octave Matlab这类工具许多复杂的代码几行就能实现”

   Question:

正确答案BC(无监督学习)   AD(有监督学习)

标签:知识点,吴恩达,预测,样例,监督,笔记,学习,算法,数据
来源: https://blog.csdn.net/qq_43603281/article/details/122506921