KBGAN:用于知识图谱嵌入的对抗学习
作者:互联网
生成式对抗网络介绍
生成对抗网络(GAN)最初被提议用于在连续空间中生成样本,例如图像。
GAN 网络由两部分组成,生成器和判别器。 生成器接受噪声输入并输出图像。 鉴别器是一个分类器,它将图像分类为“真”(来自真实数据集)或“假”(由生成器生成)。 在训练 GAN 时,生成器和判别器是在做极小极大博弈,其中生成器尝试生成“真实”图像来欺骗判别器,判别器尝试将它们与真实图像区分开来。
随机采样
随机采样方法采用随机替换头尾实体的方式用于负采样,生成的负三元组明显是错误的,因此对训练的贡献很小。
- 基于 log-softmax 损失函数的模型通常在每次迭代中为一个正三元组采样数十或数百个负三元组,其中可能有一些有用的负数,因此传统负采样的缺陷对此类模型影响不大。
- 然而,对于负正比始终为 1:1 的 margin-loss 函数,均匀采样的低质量负样本会严重损害其性能。
KBGAN
针对随机采样的缺陷,论文提出了一个对抗学习框架(KBGAN)用于提升知识图谱嵌入模型的性能。
KBGAN使用两个模型,一个作为生成器,生成高质量的负样本;一个作为判别器,用正样本和生成器生成的负样本进行训练。
生成器选用基于概率的、log-loss的模型生成更高质量的负样本,判别器选用基于距离的、margin-loss的模型,生成最终的知识图谱嵌入。
KBGAN独立于模型的具体形式,所以无论复杂性如何,所有模型都可以潜在地合并到KBGAN中。
margin-loss 函数,普遍用于基于翻译的模型,距离越小,为真的可能性越大,如 TRANSE 、TRANSH 、TRANSR 和 TRANSD 等。损失函数如下:
实验
数据集:FB15k-237、WN18、WN18RR
标签:采样,嵌入,判别,图谱,KBGAN,生成器,生成,模型 来源: https://www.cnblogs.com/yanchaoyi/p/15682197.html