其他分享
首页 > 其他分享> > SParC: Cross-Domain Semantic Parsing in Context 论文解读

SParC: Cross-Domain Semantic Parsing in Context 论文解读

作者:互联网

 

前言:SParC是一个基于 Spider 数据集扩展的有上下文依赖的对话是 Text-to-SQL 数据集。不同于 Spider 一句话 对应一个最终 SQL,SParC 通常需要通过多轮对话来实现用户的查询意图,并且在交互过程中,用户会省略很多之前提到的信息,或者新增、修改之前提到过一些内容,使得该任务更具挑战性。

 

基本信息

 

榜单概览

截至 2021年5月22日,该数据集的榜单最高准确率(Accuracy)才 Question Match 62.4%,Interaction Match 38.1%,而且第一名还是数据集作者本人 余涛。Spider、SParC、CoSQL数据集都是他们组发布的,相应的也刷了很多会议论文,很是羡慕了,自己做数据集,提出模型,发表论文,不断迭代。

 

数据集简介

 

首先,文中举了两个 SParC 的数据样例,来直观感受一下这种对话式的,且问句(Question)有上下文依赖的 Text-to-SQL数据集样例。这类数据集最早的是 ATIS 数据集(发表于 1990 和 1994 的两篇论文中),是关于航班预订的单领域多论文对话 Text-to-SQL 数据集。本文提出的 SParC 数据集相对于 ATIS 有如下三大优势:

 

下表为 SParC 与当前已有的 Text-to-SQL 数据集的对比,主要是看和 ATIS 的对比:

 

之前提到 SParC 上下文有更复杂的依赖关系,主要是以下四种情况:

从上表可以看出,每种情况都有对应的解释和一个例子,及在整个数据集中所占比例,介绍如下:

 

数据集的统计分析数据上和 ATIS 的对比如下:

 

不同轮数之间的 SQL token 的重叠比例,以此来看出每句之间的重叠程度,从下图可以看出,相邻的两轮之间重叠程度更多。

 

实验

作者主要对比了两个 baseline 模型,CD-Seq2Seq 和 SyntaxSQL-con。主实验结果如下:

这是个很有意思的结果,在 Question Match 这个指标上,SyntaxSQL-con 更胜一筹,而在 Interaction Match 指标上 CD-Seq2Seq 更高一些。文中也分析了原因,即 SyntaxSQL-con 在第一轮对话时表现出更高于 CD-Seq2Seq 的准确率,故拉升了在 Question Match 这个指标的分数,而随着对话轮数的增多,效果明显不如 CD-Seq2Seq,这是因为 CD-Seq2Seq 在建模历史对话内容的能力上更强一些,更能有效利用历史信息,所以在 Interaction Match 指标上效果更好。

下面是对话轮数和分数的表格:

更多有用的干货,欢迎关注我的 Gong众号:【AI分享者】,不定期更新实用工具、科研干货、竞赛刷题心得等。

标签:Domain,Semantic,Cross,Seq2Seq,问题,SParC,SQL,数据,Match
来源: https://blog.csdn.net/baidu_20163013/article/details/117187333