首页 > 其他分享> > 机器学习实战——决策树

机器学习实战——决策树

2021-07-02 22:30:11 作者：互联网

在这里插入图片描述
一些问题
如果训练集有100万个实例，训练决策树大致的深度是多少？

通常来说，二元决策树训练到最后大体都是平衡的，如果不加以限制，最后平均每个叶节点一个实例。因此，如果训练集包含100万个实例，那么决策树的深度为20层。（实际上会更多一些，因为决策树通常不可能完美平衡。）

通常来说，子节点的基尼不纯度是高于还是低于其父节点?是通常更高/更低？还是永远更高/更低？

一个节点的基尼不纯度通常比其父结点低。CART算法分类每个节点的方法，就是使其子节点的基尼不纯度的加权之和最小。但是，如果一个子节点的不纯度远小于另一个，那么也有可能使子节点的基尼不纯度比起父节点高。

如果决策树对训练集欠拟合，尝试缩放输入特征是否为一个好主意？

标签：实战,机器,训练,缩放,纯度,基尼,节点,决策树
来源： https://blog.csdn.net/weixin_41413511/article/details/118424024