有监督学习 and 无监督学习
作者:互联网
此系列笔记来源于
Coursera上吴恩达老师的机器学习课程
机器学习:
计算机程序根据经验E,去处理任务T,用指标P来测量评判。
a computer program is said to learn from experience E with respect to
some task T and some performance measure P, if its performance on T,
as measured by P, improves with experience E.
机器学习主要分为有监督学习和无监督学习
有监督学习 Supervised Learning
有监督学习指的是有正确答案(数据集、已知正确事实)的预测学习。比如房价的预测,有实际的数据,根据数据进行预测。
有监督学习解决了两类问题:回归问题 和 分类问题。
回归问题往往指输出数据连续的相关问题,一般如房价预测,给定房子的相关特征(variables)后这些房价的数据是连续的。最终则是要预测一个具体的值,比如可以通过已知数据做出一条直线、二次函数……来预测所要的值
分类问题往往指的是输出数据离散的相关问题,如判断一个肿瘤是恶性还是良性,我们可以根据肿瘤大小,将结果分为0(良性) 和 1(恶性),当然其特征数量也可以是两个、三个乃至无穷。
无监督学习 Unsupervised Learning
无监督学习指的是没有给定正确答案的预测学习。
我们可以通过给定数据中提取出变量之间的结构、关系,无监督学习没有基于预测结果的反馈。
无监督学习可以分为聚类问题Clustering 和 Non-clustering
聚类问题:即将数据归类,例如:给定一个基因的数据集,我们可以通过基因中的各种特征,将基因归类
非聚类问题:例如:鸡尾酒宴算法,给定一个混乱的声音,我们从中提取相关信息,如将背景音乐和人声分开提取出来。
标签:问题,预测,学习,监督,给定,数据 来源: https://www.cnblogs.com/yramvj/p/16197579.html