西瓜书第一章笔记
作者:互联网
在这里先列举一些我先前不了解的基本术语:
根据一些样例,来训练我们的模型。如果预测的是离散值,例如“好瓜” “坏瓜”,这种学习任务我们称为“分类”(classification);如果预测的是连续值,例如西瓜的成熟度0.95、0.37,这类任务称为“回归”(regression)。
泛化能力(generalization):学得的模型适用于新样本的能力。
西瓜书第五页:空间规模的大小为什么是444+1=65?
1.先整体考虑,色泽有4个属性(+浅白+青绿+乌黑),同理根蒂和敲声也有4个(在书中表示通配符,比如色泽=* 表示色泽可以取值任何颜色而不影响最终结果“好瓜”)。
因此3个属性有四个属性值可以任意选择,444=64,此外,考虑极端情况,如果“好瓜”这个概念本身不成立,世界上没有“好瓜这种东西”,也就是说瓜都不存在了,
(色泽=\(\emptyset\))\(\wedge\)(根蒂=\(\emptyset\))\(\wedge\)(敲声=\(\emptyset\)),那么这也算一种情况。也许你又有新的疑问,能不能其中一个或两个属性为空值呢?这是瓜,实实在在的瓜,你能想象一个瓜有敲声,而没有色泽和根蒂的情况吗?最后64+1=65。
2.分开考虑,这里不使用通配符*。有3个属性,每个属性有3个值。
如果一个属性就能判定结果是否“好瓜”,则3个属性中选一个,属性值有3种,即\(C_3^1*3 = 9\)。
同理,两个属性,\(C_3^2*3*3 = 27\)。三个属性,\(C_3^3*3*3*3 = 27\)。此时27+27+9=63.还有两种情况,一种是无论属性的属性值取什么,都是好瓜,这对应于上个方法的各个属性取通配符,另外一种是空集。63+2=65.
西瓜书\({P_8}\)~\({P_{\rm{9}}}\)页
没有免费的午餐定理:
(暂时先更新到此,这个定理有待琢磨)
学习动力:2020年11月11日晚上因宿舍灭蚊而不得不和室友去教学楼学习。
标签:27,好瓜,根蒂,笔记,第一章,西瓜,emptyset,色泽,属性 来源: https://www.cnblogs.com/c-free520/p/13962563.html