gan和vae

2021-09-20 14:34:54 作者：互联网

对于GAN和VAE, 当我们说模型对数据具有很好的表征时，意思是对于数据集中的某个采样/样本 x, 必然有个隐变量(Latent variable) z让模型能够生成跟 $x$ 非常相似的数据。用数学语言讲，就是对于高维空间 $\Zeta$ 中的向量 $z$ , 我们可以定义概率密度函数(probability density function, PDF) $p\left( z \right)$ . 这样我们有一个确定性函数 $f\left( z;\theta \right)$ , 其中 $\theta$ 是高维空间 $\Theta$ 中的向量. 这里 z是随机的，但 $\theta$ 是固定的参数，所以 $f\left(\ z ; \theta \right)$ 是定义在高维空间 $\Chi$ (训练数据 $x$ 所在空间)中的随机变量。我们希望优化参数 $\theta$ , 让 $f\left(\ z ; \theta \right)$ 尽量的接近于我们的样本数据集 $X$ . 这里把 $f \left( z,\theta \right)$ 替换成 $p\left( x|z;\theta \right)$ , 则有 $p\left( x \right) = \int p\left( x|z;\theta \right)p\left( z \right)dz$ . 这个优化的过程，就是把数据从某种分布（常见的是混合高斯分布）映射到已知的数据分布（来自于训练数据集）的过程，如果训练数据集有代表性并且数量足够的话，这个目标性已知分布等价于这类数据对象的真实分布。

数据分布的映射其实很常见，上图中就是把一个二维均匀分布通过映射成圆环样分布的过程。实际上，对于我们人类来说，记忆的提取(回忆)也是这样类似的机制：我们对世界的认知知识信息存储在大脑神经网络的连接权重中，相当于网络的固定参数 $\theta$ , 我们的记忆相当于动因 $z$ ，而我们回忆的过程中给予记忆以形象。

“When one understands the causes, all vanished images can easily be found again in the brain through the impression of the cause. This is the true art of memory...”
—— Rene Descartes, Cogitationes privatae.

这套数据分布映射的算法思想从Helmholtz Machines[1]起就比较成熟了。至少从理论上来看，通过分布的映射把看起来随机的一组向量对应到现实世界中的数据是比较自洽的。怎么处理这样的映射关系是GAN和VAE的本质不同。

标签：维空间,映射,vae,gan,数据分布,数据,我们,向量
来源： https://blog.csdn.net/qq_35985044/article/details/120390789