其他分享
首页 > 其他分享> > 西瓜书:第一章 绪论

西瓜书:第一章 绪论

作者:互联网

1.1 基本术语
假定我们收集了一批关于西瓜的数据,例如:
(色泽=青绿;根蒂=蜷缩;敲声=浊响),
(色泽=乌黑;根蒂:稍蜷;敲声=沉闷),
(色泽=浅自;根蒂t硬挺;敲声=清脆),
……,

每对括号内是一条记录,

如果预测的是离散值,此类学习任务称为“分类”(classification),例如“好瓜”、“坏瓜”;

如果预测的是连续值,此类学习任务称为“回归”(regression),例如西瓜成熟度0.95、0.37;

也可以对西瓜做“聚类”(clustering),即将训练集中的西瓜分成若干组,每组称为一个“”(cluster);这些自动形成的簇可能对应一些潜在的概念划分,例如“浅色瓜”,“深色瓜”。这样的学习过程有助于我们了解数据内在规律,能够为更深入地分析数据建立基础。注意一点,聚类学习中,“浅色瓜”,“深色瓜”这些概念事先是不知道的,而且学习过程中使用的训练样本通常无标记信息。当然也有例外情况。

根据训练数据是否有标记信息,学习任务可大致分为两大类:“监督学习”(supervised learning)和“无监督学习”(unsupervised learning),分类和回归是前者的代表,聚类是后者的代表

学得到模型适用于新样本的能力,称为“泛化”(generalization)能力,具有强泛化能力的模型能很好地适用于整个样本空间。

loveysuxin 发布了70 篇原创文章 · 获赞 29 · 访问量 4万+ 私信 关注

标签:西瓜,敲声,绪论,称为,色泽,根蒂,第一章,学习
来源: https://blog.csdn.net/LOVEYSUXIN/article/details/104055142