其他分享
首页 > 其他分享> > 6-集成学习和随机森林

6-集成学习和随机森林

作者:互联网

理论部分

随机森林定义

投票分类器

bagging和pasting

包外估计

随机补丁和随机子空间

随机森林

提升法

\[每个实例权重w^{(i)}最初设置为\frac{1}{m},第j个预测器的加权误差率为: \\ r_j = \frac{\underset {\hat y^{(i)}_j≠y^{(i)}} \sum^m_{i=1}w^{(i)}}{\sum^m_{i=1}w^{(i)}} \\ \hat y^{(i)}_j是第i个实例的第j个预测器的预测 \]

\[预测器权重:\alpha_j=\eta log\frac{1-r_j}{r_j},其中\eta是学习率超参数,默认为1 \]

\[实例权重更新规则:对于i=1, 2, ..., m \\ w^{(i)}←\left\{\begin{matrix} w^{(i)},如果\hat y^{(i)}_j=y^{(i)} \\ w^{(i)}exp(\alpha_j),如果\hat y^{(i)}_j≠y^{(i)} \end{matrix}\right . \]

\[预测的时候,AdaBoost就是简单地计算所有预测器的预测结果,并使用预测器权重\alpha_j对它们进行加权,最后,\\ 得到大多数加权投票的类就是预测器给出的预测类 \\ AdaBoost预测 \\ \hat y(x) = {\underset {k} argmax}{\underset {\hat y_j(x)=k} \sum^N_{j=1}}\alpha_j,其中N是预测器的数量 \]

梯度提升

img

img

img

堆叠法

代码部分

标签:集成,实例,训练,分类器,GBDT,随机,预测器,森林
来源: https://www.cnblogs.com/lotuslaw/p/15543843.html