其他分享
首页 > 其他分享> > 五、分类模型及超参数调优

五、分类模型及超参数调优

作者:互联网

一、分类模型

1.1、决策树

1.2、神经网络

分类的准确度高,并行分布处理能力强,分布存储及学习能力强,对噪声神经有较强的鲁棒性和容错能力,能充分逼近复杂的非线性关系,具备联想记忆的功能等。

神经网络需要大量的参数,如网络拓扑结构、权值和阈值的初始值;不能观察之间的学习过程,输出结果难以解释,会影响到结果的可信度和可接受程度;学习时间过长,甚至可能达不到学习的目的。

1.3、支持向量机(SVM)

1.4、朴素贝叶斯

1.5、Adaboost算法

1.6、逻辑回归

大概有这些模型

二、分类模型评估

混淆矩阵是二分类问题的多维衡量指标体系,在样本不平衡时极其有用。在混淆矩阵中,我们将少数类认为是正
例,多数类认为是负例。在决策树,随机森林这些普通的分类算法里,即是说少数类是1,多数类是0。在SVM里,
就是说少数类是1,多数类是-1。普通的混淆矩阵,一般使用{0,1}来表示。混淆矩阵阵如其名,十分容易让人混
淆,在许多教材中,混淆矩阵中各种各样的名称和定义让大家难以理解难以记忆。我为大家找出了一种简化的方式
来显示标准二分类的混淆矩阵

在这里插入图片描述

准确率Accuracy就是所有预测正确的所有样本除以总样本,通常来说越接近1越好。

建立ROC曲线的根本目的是找寻Recall和FPR之间的平衡,让我们能够衡量模型在尽量捕捉少数类的时候,误伤多数类的情况会如何变化。横坐标是FPR,代表着模型将多数类判断错误的能力,纵坐标Recall,代表着模型捕捉少数类的能力,所以ROC曲线代表着,随着Recall的不断增加,FPR如何增加。我们希望随着Recall的不断提升,FPR增加得越慢越好,这说明我们可以尽量高效地捕捉出少数类,而不会将很多地多数类判断错误。所以,我们希望看到的图像是,纵坐标急速上升,横坐标缓慢增长,也就是在整个图像左上方的一条弧线。这代表模型的效果很不错,拥有较好的捕获少数类的能力。

当然我们还不只是有这些模型评估,只不过这几种模型评估事物我们常见的,希望能够了解到。

三、超参数优化

在模型建立之后,我们将得到模型预测分数,预测分类,当然我们需要了解到怎么样将超参数进行优化。可以参考上一篇和分类模型超参数一样的。
调参

最后感谢阅读,如有不足,敬请谅解,谢谢。
路漫漫其修远兮,吾将上下而求索。

标签:Recall,模型,分类,分类器,少数类,调优,参数,及超,决策树
来源: https://blog.csdn.net/weixin_45014634/article/details/115311431