其他分享
首页 > 其他分享> > Adversarial Deep Averaging Networks for Cross-Lingual Sentiment Classification

Adversarial Deep Averaging Networks for Cross-Lingual Sentiment Classification

作者:互联网

https://github.com/ccsasuke/adan

作者提出了Adversarial Deep Averaging Network (ADAN)模型,将高资源的源语言标记数据迁移到低资源未标记数据。ADAN有两个不同的分支:一个sentiment classifier和一个adversarial language discriminator。这两个分支都将feature extractor学习的隐藏层表示作为输入,同时完成分类任务和跨语言不变任务。

image-20210313105828614

​ 如图所示,在训练阶段,ADAN将源语言和目标语言同时送入模型中。未标记的source和target只通过language discriminator。只有标记的source才通过sentiment classifier(或者未标记target在测试时)。

image-20210313113351797

为了训练语言不变特征,ADAN训练F生成两个越相似越好的分布。ADAN-GRL和最小化JS散度相同,但是JS散度有不连续的问题,为训练F提供了没那么有用的梯度。

Arjovsky et al.(2017)提出了最小化Wasserstein距离,被证明提升了超参的稳定性,于是ADAN采用了这个方法(数学推导略https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/86762056)

image-20210313124057628

直觉上,Q尝试对source产生高分,对target产生低分。

image-20210313124317714

P的目标函数就是最小化负对数似然函数。

最终的loss函数:

image-20210313124834462

标签:target,Sentiment,Averaging,source,训练,ADAN,Classification,GRL,语言
来源: https://blog.csdn.net/weixin_41696015/article/details/114742478