其他分享
首页 > 其他分享> > 【每日一读】ACL2020:基于动态目标下的分层注意力网络进行对话状态追踪

【每日一读】ACL2020:基于动态目标下的分层注意力网络进行对话状态追踪

作者:互联网

在这里插入图片描述
Paper: ACL2020-A Contextual Hierarchical Attention Network with Adaptive Objective for Dialogue State Tracking
Link: https://www.aclweb.org/anthology/2020.acl-main.563.pdf
Code: https://github.com/ictnlp/CHAN-DST

这是一篇关于 对话状态追踪(DST) 任务的论文,在 Intro 部分,作者提出了当前DST任务存在的两个问题:
在这里插入图片描述

基于以上的两个问题,本文分别设计了Contextual Hierarchical Attention Network (CHAN)Adaptive Objective 来进行解决:
在这里插入图片描述
具体地,Contextual Hierarchical Attention Network 由如下几部分构成:

关于 Slot Imbalance 的问题,作者设计了 Adaptive Objective , 通过评估每个类型 slot 预测的难度来自适应地设计该slot对应的权重, 具体包括如下步骤:

作者在 MultiWOZ2.0MultiWOZ2.1 上进行了实验,均取得了 SOTA 效果:
在这里插入图片描述
并通过消融实验验证了不同模块对最终结果的影响:
在这里插入图片描述

在这里插入图片描述


了解更多深度学习相关知识与信息,请关注公众号深度学习的知识小屋

标签:slot,Slot,DST,Attention,任务,分层,对话,一读,ACL2020
来源: https://blog.csdn.net/carrie_0307/article/details/113250989