【乱写】机器学习
作者:互联网
机器学习的任务分类
任务一:所有的经验E是由人工采集并输入计算机的【监督学习】
1.(告诉机器每个样本这个是什么)就是为训练数据打标签
经验E=>训练样本和标签的集合
任务二:计算机通过与环境的互动逐渐强化自己的行为模式【强化学习】
计算机产生行为=>程序定义这些行为的收益函数(reward function),对行为进行奖励或惩罚=>反馈,并改变自己的行为模式去最大化收益函数
经验E=>计算机与环境互动获得的
机器学习算法分类(并不绝对)
监督学习和强化学习
Ps:但往往相互结合,以求最佳迭代
监督学习根据数据标签存在与否的分类
1.传统的监督学习
每个训练数据都有对应的标签
该分类下支持的算法:
①:支持向量机
②:人工神经网络
③:深度神经网络
2.非监督学习
所有训练数据都没有对应的标签
(不需要标签也能训练数据)存在的证明:
Ps:图像可以反映:训练样本在空间的分布
首先假设:有这些训练数据,但不知道训练数据的类别
那么数据如何分类
需要假设:同一类的训练数据在空间中距离更近=>样本空间的信息=>设计算法将它们聚集为两类=>无监督学习
该分类下支持的算法:
①:聚类
②:EM算法
③:主成分分析
3.半监督学习{最近获得很多的关注}
训练数据中一部分有标签一部分没有标签。
这种学习产生的原因:
1.网络存在大量数据
2.标注数据却是成本巨大的工作
3.利用少量标注的数据,来标注大量未标注的数据,一起训练一个更好的机器学习算法
数据的分类方式:
第一种方式:我们标注了2个样本但不知道分类,但是如果我们增加一些没有标签的训练样本,那么我们设计算法就能更好的实现分类。【看图说话和数学公式】
第二种方式:基于标签的固有属性
监督学习:①分类:标签是离散的值②回归:标签是连续的值
分类例如:人脸识别就是分类问题
它的任务:
①(模式1)判断两个脸是不是同一个,若是为1,若不是为0。
标签就是0和1,这种离散的数值。
②(模式2)这个脸是一堆人脸里的哪一个。这个标签为1,2,3一直到N
回归例如:预测重庆房价的走势
它的任务:
训练样本是时间,标签是重庆的房价,由于房价是连续的变量,所以这是一个回归的问题
同样的预测股票价格,预测温度,预测人的年龄
PS!!!!:分类和回归问题的界限其实是非常模糊,因为连续和离散的定义是可以相互转换的。
机器学习模型解决分类问题,而回归就要自己想了。而且机器学习也只是解决问题的一种模型。
标签:机器,训练,乱写,标签,分类,学习,算法,数据 来源: https://blog.csdn.net/real_scdbj/article/details/110943233