其他分享
首页 > 其他分享> > 【基础理论】专题1 泛化到底是什么?

【基础理论】专题1 泛化到底是什么?

作者:互联网

文章目录


1 欠拟合、过拟合

2 期望误差、经验误差、结构误差

3 什么是“泛化性(Generalization)”

泛化是指在训练集上的经验性能是否会在未知数据集上表现出差不多的性能。性能同样好,就可以认为是泛化性较好。

通俗解释:你在训练集上得到好的性能,是否意味着在整体上得到好的性能,这就是泛化。
在这里插入图片描述
对于上图,蓝色函数与数据集吻合(因为经验误差为0)。但很明显,在未知的数据中,性能将表现不佳。因此,该模型的泛化性较差。

4 奥卡姆剃刀原理

这个原理就是“如非必要,勿增实体”(Entities should not be multiplied unnecessarily)。

奥卡姆剃刀原理是指,在科学研究任务中,应该优先使用较为简单的公式或者原理,而不是复杂的。应用到机器学习任务中,可以通过减小模型的复杂度来降低过拟合的风险,即模型在能够较好拟合训练集(经验风险)的前提下,尽量减小模型的复杂度(结构风险)。

https://blog.csdn.net/oppo62258801/article/details/89174877

在所有可能选择的模型中,能够很好地解释已知数据并且十分简单才是最好的模型,也就是应该选择的模型。

《统计学习方法》李航

问:奥卡姆剃刀原理是否是正确的?

可能正确,他不保证100%正确。但可以保证在现有已知事实下,不做无谓的思考。奥卡姆剃刀原理理解为“问题的复杂度应该和方法的复杂度相匹配”会更贴切一些,简单问题不应去增加模型的复杂度来解决。通俗点讲,对于一个简单问题,应该用简单的方法去解决,而不应该去增加模型的复杂度。

5 一些定义

5.1 假设空间

一系列函数。Hypothesis f s ∈ H : X → Y f_s \in H : X \rightarrow Y fs​∈H:X→Y

5.2 学习算法

在这里插入图片描述

5.3 一致性(Consistency)

选出的算法是否是分类其中最优的。“一致”指的是与“最优的”一致。
在这里插入图片描述

5.4 经验风险最小化(Empirical Risk Minimization(ERM))

在函数族中,找到最好的假设函数 H H H使在训练集上经验误差最小。

公式详解等后期补更。。。。。

6 VC-维(VC-Dimension)

6.1什么是 H H H打散

6.2什么是VC-Dimension

7 Vpnik的贡献是什么?

8 Poggio的贡献是什么?

9 Rademacher的贡献是什么?

10 其他一些问题

10.1 什么样的函数具有泛化性能?

10.2 什么是稳定性?

10.3 C V L O O 、 E L O O 、 E E L O O 、 C V E E E L O O CV_{LOO}、E_{LOO}、EE_{LOO}、CVEEE_{LOO} CVLOO​、ELOO​、EELOO​、CVEEELOO​的稳定性?如何证明?其一致性呢?

参考文献:

[1] Poggio T , Rifkin R , Mukherjee S , et al. General conditions for predictivity in learning theory[J]. Nature, 2004, 428(6981):419-22.

[2]Cucker, Felipe, Smale, et al. ON THE MATHEMATICAL FOUNDATIONS OF LEARNING.[J]. Bulletin (New Series) of the American Mathematical Society, 2002.

标签:误差,专题,泛化,复杂度,LOO,经验,拟合,基础理论
来源: https://blog.csdn.net/Aibiabcheng/article/details/121297325