其他分享
首页 > 其他分享> > 西瓜书学习笔记一(第一章第二章)

西瓜书学习笔记一(第一章第二章)

作者:互联网

第一章绪论

`

1.2基本术语

数据集:各种数据的一个集合

学习/训练:从数据中学得模型的过程

标记:训练样本结果的信息(例如好瓜坏瓜)

测试:学得模型后,使用其进行预测的过程

回归:预测的是连续值

分类:预测的任务是离散值时

聚类:训练集中分成若干个组,每个组称为一个簇,这些自动形成的簇对应一些潜在概念划分

泛化:学得模型适用于新样本的能力

`

1.3假设空间

"归纳学习":顾名思义,从样例中学习显然时一个归纳的过程

假设空间:我们可以把学习过程看作一个在所有假设(hypothesis) 组成的空间中进行搜索的过程,搜索目标是找到与训练集"匹配"的假设,即能够将训练集中的瓜判断正确的假设.假设的表示一旦确定,假设空间及其规模大小就确定了.

版本空间:与训练集一致的"假设集合"

1.5发展历程

数据储量爆发式增长,计算机算力的增强带动了机器学习的发展

第二章模型评估和选择

2.1经验误差与过拟合

误差:学习器的实际预测输出与样本的真实输出之间的差异

拟合:

2.2评估方法

训练集 用于训练模型

测试集 用于验证模型

三种方法

调参与最终模型

2.3性能度量:

性能度量有衡量模型泛化能力的评价标准

性能度量反映了任务需求,在对比不同模型的能力时,使用不同的性能度量往往会导致不同的评判结果;这意味着模型的"好坏"是相对的,什么样的模型是好的,不仅取决于算法和数据,还决定于任务需求.

2.3.1错误率和精度

2.3.2查准率、查全率与Fl

标签:训练,模型,样本,笔记,第一章,学习,训练样本,第二章,数据
来源: https://www.cnblogs.com/GodoneZ/p/16372971.html