其他分享
首页 > 其他分享> > 决策树(一)

决策树(一)

作者:互联网

基本流程

决策树是异类常见的机器学习方法,以二分类任务为例,我们希望从给定训练数据集学得一个模型以对新示例进行分类,决策树是基于树的结构进行决策的。
一般地,一颗决策树包含一个根节点,若干个内部节点和若干个叶节点,叶节点对应于决策结果,其他各个节点则对应于下一个属性测试。

算法原理

从逻辑角度,一堆if else语句的组合
从几何角度,根据某种准则划分特征空间
最终目的:将样本越分越纯

剪枝处理

剪枝是决策树学习算法对付“过拟合”的主要手段。在决策树学习中,为了尽可能正确分类样本,结点划分过程将不断重复,有时候会造成决策树分支过多,以至于吧训练集自身的一些特点当做所有数据具有的一般性质而导致过拟合。因此,可通过主动去掉一些分支来降低过拟合的风险。
决策树剪枝的基本策略有“预剪枝”和后剪枝。

标签:剪枝,划分,增益,Ent,决策树,属性
来源: https://blog.csdn.net/qq_43689908/article/details/121477530