编程语言
首页 > 编程语言> > 周志华《机器学习》西瓜书 小白Python学习笔记(一) ———— 第一章 绪论 & 第二章 模型评估与选择

周志华《机器学习》西瓜书 小白Python学习笔记(一) ———— 第一章 绪论 & 第二章 模型评估与选择

作者:互联网

周志华《机器学习》西瓜书 小白Python学习笔记(一)——第一章 绪论 & 第二章 模型评估与选择

写在最前

博主是统计专业本科在读,之前利用一个学期的时间粗略地学习《机器学习》全书一遍,了解了书中知识理论的基本情况。准备申请机器学习相关专业的研究生,无奈第一遍的学习太过于浮于表面,于是决定回锅学习第二遍!这一遍的重点将放在对算法流程的理解与Python的实现,希望通过这一遍的学习之后,能够独立搭建起相关算法的框架。概括地说,就是一个小白学习Python实现机器学习算法的过程,希望能给有相似经历的朋友们一些启发,更欢迎大家指导、相互交流学习~~

第一章 绪论 & 第二章 模型评估与选择

既然是开始学习机器学习这个学科,肯定会有“那究竟什么是机器学习?”等等问题。
合上书本,让我们来看下面的例子。看完之后,大家会对机器学习与基本术语的有一个大概的了解。

借助周志华老师贯穿全书的“西瓜”。对于西瓜来说,我们所关注的是瓜是不是好吃,换句话说就是,我们要判断一个西瓜是“好瓜”还是“坏瓜”。但是当我们到市场买西瓜的时候一般是无法切开或者品尝的,就需要根据我们已有的经验,比如说瓜皮的色泽瓜蒂的状态、以及拍打的声响(这个估计是大家经常尝试的哈哈哈),来判断一个瓜是不是好瓜,以此来帮助我们买到好瓜。接着看下面的一个小故事:

小明的老婆很喜欢吃西瓜,由于连续几次买到了没熟的瓜,被老婆训斥,小明下决心提高辨别好瓜坏瓜的技巧,努力变成一个“买瓜达人”,来获得老婆的芳心。
小明一气之下在市场不加挑选随机地买了100个西瓜放到了自己的秘密仓库中,给他们编号1-100。
首先,取出前70号西瓜堆在一起,与另外30个西瓜分隔开,然后拿笔记本记录下来每个西瓜的三个特征的情况,分别是 “色泽”“瓜蒂”“拍打声”,并把每个西瓜拿刀切开品尝,记录是 “好瓜” 还是 “坏瓜”
之后,小明拿着记录着1-70号西瓜“色泽”、“瓜蒂” 、 “拍打声”和“好瓜还是坏瓜”四项信息的笔记本来到了自己的书房,研究这70个西瓜三个特征与好瓜之间的关系,企图发现其内在规律,将其变成自己买瓜的经验。经过三天三夜的研究,小明总结出了了一套
*“买瓜秘笈”**,根据这套卖瓜秘笈的方法,小明可以正确判断出这70个西瓜中的65个,正确率高达87%!
于是,小明胸有成竹地走出书房,来到自己藏着另外30个西瓜的仓库,准备真刀真枪检验一下自己“买瓜秘笈”的效果。分别观察71-100号30个西瓜的三个特征,小明根据自己的秘笈,判断这30个西瓜是不是好瓜。记录下自己的答案后,小明将71-100号西瓜切开品尝,得知每个瓜是不是好瓜之后与自己的判断进行对比,仔细观察,小明将10个坏瓜中的1个判别为了好瓜,将20个好瓜中的两个判别成了坏瓜,正确率高达90%,!
就这样,小明变成了“买瓜达人”,不仅俘获了老婆的芳心,甚至隔壁李奶奶都会来找他帮忙买瓜……*

现在让我们回过头来看上面的例子,我们可以引出一些机器学习中的基本术语,将其分为基本概念与模型评估两类:

1.基本概念

2.模型的评估

以上便是通过一个小故事对第一章与第二章中的一些基本术语的梳理,博主认为此处对概念有一个基本的认识就可以了,在后面的学习中会逐步加深理解,此处无需太费精力纠结一些概念。

标签:周志华,小明,秘笈,西瓜,绪论,Python,好瓜,学习,正确率
来源: https://blog.csdn.net/River_J777/article/details/105279136