其他分享
首页 > 其他分享> > 【Gaze】A Survey on Using Gaze Behaviour for Natural Language Processing

【Gaze】A Survey on Using Gaze Behaviour for Natural Language Processing

作者:互联网

A Survey on Using Gaze Behaviour for Natural Language Processing

1. Abstract

摘要中主要介绍本文的工作,整篇主要讨论了在NLP领域gaze behavior用来处理的不同task。gaze behavior属于认知领域,它的收集是一个很费时费钱的工作。因此本文专注于研究模型在运行时的注视行为,并且也描述了多语言任务中的不同的eye tracking语料库。最后通过讨论应用点以及gaze behavior如何能够帮助解决一些文字识别和自动论文评分的复杂问题来总结整篇文章。

2. Introduction

采集读者的心理语言信息对于NLP中多种任务均有帮助,比如NER,文本质量评级预测,讽刺的可理解性。gaze behavior通过眼睛-思维假说(即“在被注视的东西和被处理的东西之间没有明显的滞后”),已经被证明与文本的认知处理很好地相关。因此它能够很好的解决一些NLP任务,大部分的挑战将关注点放在了如何采集gaze behavior。在该文章中,作者主要描述了在运行时使用注视行为来解决不同的NLP任务的研究。

首先需要对gaze behavior的一些term进行了解:

请添加图片描述

3. Motivation for Learning Gaze Behavior

读者的凝视行为可以为系统提供有价值的心理语言学信息,以帮助他们解决需要智力的任务。例如,使用凝视行为,可以更好地量化句子翻译的难度,或者验证读者是否理解一篇文本中的讽刺,甚至评估单词嵌入的质量。

就在2018年,心理语言学领域的论文还描述那些将提供移动/便携式眼球追踪系统的工作。Mishra等人提到,在智能手机和平板电脑等手持设备上,很快就会有眼球追踪器出现。Mathias还提到,SR研究公司已经发布了一款便携式眼动仪。所有这些系统都需要读者阅读文本,以收集注视行为信息。我们在本文中的目标是向人工智能受众介绍我们减轻读者在运行时阅读文本以收集注视行为的需求的方法。

4. Eye Tracking Corpora

请添加图片描述

5. Tasks Where Gaze Behaviour is Used

最早假设gaze behaviour效用的工作之一是由Just and Carpenter[1980]所做的关于阅读理解的研究。他们提出了眼-思维假说,即“在由眼睛注视的东西和由大脑处理的东西之间没有明显的滞后。”认知科学领域的许多研究发现,凝视行为的不同方面与文本的相应方面之间的关系,比如注视和单词长度之间的关系,单词可预测性等。

gaze behaviour也有助于NLP中的多个任务,其中读者的心理输入是至关重要的,而仅凭文本特征将是不够的。Mishra等[2013]讨论了与使用基于长度的统计数据(如单词长度、句子长度等)相比,使用gaze behaviour是一种更好的方法来判断翻译句子的复杂性。理解讽刺文本也可以通过凝视行为来解决,即文本中的不协调(讽刺的主要指标之一)会导致凝视行为,即注视时间较长、回归等。gaze behaviour也被用于识别读者的母语,以及用于检测压缩句子中的语法错误。Klerke等人[2015a]还表明,凝视行为可以比自动指标更好地用来评估机器翻译系统的输出。凝视行为也被用来评估读者如何评价一篇文本的质量。

读者的扫描路径(即读者阅读文本时眼睛走过的路径)被用来测试一篇文本对读者的难易程度。它还可以用来预测有阅读困难的儿童的误读情况.

注视行为也被用于情绪分析的多个领域,如讽刺检测、讽刺理解和情绪分析注释任务。Klerke和Plank等人[2019]解决了使用注视数据的POS(词性)标记的经典问题,并提供了两个独立层次的注视数据聚合对低级句法标记任务的影响的系统概述;即,一个简单的块边界标记和一个有监督的POS标记任务。

6. Learning Gaze Behaviour

如前一节所述,使用注视行为可以帮助系统解决许多NLP任务。然而,学习注视行为仍然是一个相对较新的挑战。在运行时学习注视行为的最大好处是,减轻了阅读为了获取注视行为信息的文本的要求。本节将介绍不同的任务和不同的系统,以减轻在运行时收集注视行为的需要。

6.1 NLP Tasks

6.2 System Architectures

6.3 Normalizing Data

在收集注视行为数据时,最好让读者的注视行为归一化。注视行为以下方式进行标准化。

6.4 Results

请添加图片描述

表2给出了每个不同的NLP任务的结果,其中本文没有记录在运行时的注视行为。由于空间限制,作者对每个NLP任务只报告1个结果和数据集的结果。我们报告了最佳的基线结果,相应的注视行为系统的结果,百分数的改善,以及表现的改善是否具有统计学意义。

7. Applications of Learning Gaze Behaviour

本节主要介绍一些可以从学习注视行为中获益很多的NLP应用。据我们所知,在这些系统学习注视行为的应用程序中,还没有任何工作。

7.1 Complex Word Identification

词汇简化是指通过用更简单的单词和短语代替复杂的单词和短语来简化文本的一个过程。例如,一个非英语母语的人会很难理解“谩骂”这个词的意思,也就是“纳粹的宣传诋毁犹太人”。然而,他们更有可能理解“纳粹宣传诋毁犹太人”这句话的含义。识别哪些单词是困难的(应该被一个适当的同义词取代)的过程对于使用眼球追踪是一个非常有用的应用,因为读者可能会更长时间关注更难的单词[Rayner,1998]。

[Paetzold and Specia, 2016]报告了2016年Sem-Eval举行的复杂单词识别共享任务的结果。2018年组织了另一项共享任务,用英语、西班牙语、德语和跨语言设置(目标语言是法语)来识别复杂的单词和短语[Yimametal.,2018]。

使用认知信息应该有助于解决这些任务。如前所述,有相当多的论文涉及文本复杂性/简化和可读性,它们使用凝视行为。然而,在提出共享任务的解决方案时,没有人使用认知信息。随着大量不同语言的眼球追踪语料库的可用性,一个有趣的研究途径将是探索如何使用注视行为来帮助识别复杂的单词,即使在运行时没有这样的信息。

7.2 Automatic Essay Grading

文章是一种文本,是对一个主题的回应,称为文章提示。对一篇文章进行评分是指根据文章的质量给文章评分,要么是文章的整体(整体评分),要么是文章的特定方面(特定特质评分)。论文自动评分(AEG)是指用机器对一篇论文进行评分的过程。最早的AEG系统是在50多年前由[Page,1966]描述的。从那时起,出现了许多商业的AEG系统,如E-Rater、Intelligent Essay Assessor、 LightSide等。

目前最先进的AEG系统使用神经网络,如CNNs,LSTMs,或两者。他们使用的数据集是2012年自动学生评估奖(ASAP)AEG数据集,由休利特基金会发布。

如前所述,[Mathias等人,2018]描述了一种预测读者根据其质量给文本的评分的方法。他们的工作表明,我们可以将凝视行为用于类似的应用程序,如AEG。然而,[Mathias等人,2018]的方法要求读者阅读文本,以使用读者的凝视行为。使用多任务学习建立的AEG系统,主要任务是在文档级对论文进行评分,而学习注视行为是单词级的辅助任务。[Barrettetal.,2018]已经表明,这种方法有利于多个NLP任务,如情绪分析、语法错误检测和仇恨语言检测。

8. Conclusion

凝视行为已被证明有助于多种自然语言处理任务。然而,在运行时收集注视行为是不可行的。因此,为了使用注视行为,很多研究使用了不同的方法,如多任务学习,使用类型聚合值等。

本文首先向人工智能受众介绍不同的NLP任务,这些任务通过注视行为来解决,如翻译复杂性、讽刺可理解性、文本质量评级预测等。然后作者讨论不同的任务,其中表明注视行为有助于他们的解决方案。

为了实现这些任务,需要注视行为数据来为训练做好准备。本文还报告了用多种语言创建的注视行为数据集。最后,描述了来自教育领域的一对应用程序——复杂的单词识别和自动论文评分——它们可以从使用基于注视行为的解决方案中获益很多。

标签:Natural,Language,行为,al,单词,任务,Gaze,et,注视
来源: https://blog.csdn.net/qq_42801194/article/details/123234459