其他分享
首页 > 其他分享> > Bilateral Multi-Perspective Matching for Natural Language Sentences

Bilateral Multi-Perspective Matching for Natural Language Sentences

作者:互联网

目录

在这里插入图片描述

论文阅读准备

前期知识储备

在这里插入图片描述
简单讲,比较就是交互匹配,聚合就是特征压缩。

学习目标

在这里插入图片描述

论文导读

论文研究背景、成果及意义

研究背景

在这里插入图片描述

相关工作

Siamese architecture

Matching-aggregative

研究成果

提出了BiMPM模型:

研究意义

论文泛读

论文结构

在这里插入图片描述
针对引言以及相关工作,首先要读,其次不要细扣每一个细节,看不懂不强求。

摘要

Natural language sentence matching is a fundamental technology for a variety of tasks.Previous approaches either match sentences from a single direction or only apply single granular(wordby-word or sentence-by-sentence) matching.

之前的工作要么单方向匹配或要么单一粒度(词粒度或句子粒度)的匹配。
阅读理解式问答:开门见山,点出前人工作的不足,为下文搬出作者自己的模型做铺垫,为后文BIMPM两大特征埋下伏笔。

In this work, we propose a bilateral multi-perspective matching(BiMPM) model. Given two sentences P and Q, our model first encodes them with a BiLSTM encoder. Next, we match the two encoded sentences in two directions P against Q and Q against P.

模型步骤:

In each matching direction, each time step of one sentence is matched against all time steps of the other sentence from multiple perspectives. Then, another BiLSTM layer is utilized to aggregate the matching results into a fixed-length matching vector.

模型步骤:

Finally, based on the matching vector, a decision is made through a fully connected layer. We evaluate out model on three tasks: paraphrase identification, natural language inference and answer sentence selection. Experimental results on standard benchmark datasets show that our model achieve the state-of-the-art performance on all tasks.

模型步骤:

论文精读

【回顾】
**问题背景:**句子匹配是一系列其他任务的基础技术,实用性广泛
两点可突破之处:

BIMPM整体结构

在这里插入图片描述
(猜测)

词嵌入层

**核心:**为了增加不同粒度的信息,在word embedding的基础上添加了字符级特征
在这里插入图片描述

Word : Glove预训练词向量
Character :

上下文表示层

核心:双向LSTM
句子P:
在这里插入图片描述

句子Q:
在这里插入图片描述

匹配层

在这里插入图片描述
正向LSTM与另外一句话的全部正向的LSTM向量进行四次匹配,反向LSTM与另外一句话的全部反向的LSTM向量进行四次匹配。这样对于句子P的一个位置,可以生成8个向量,将这8个向量进行拼接,得到上下文特征向量h,结果匹配后的向量。

聚合层+预测层

聚合层:双向LSTM
预测层:全连接+softmax
参与全连接层预测的向量为:两句话,四个LSTM网络的最终输出向量
在这里插入图片描述

多视角匹配

在这里插入图片描述
在这里插入图片描述
综上所述,匹配策略与fm构成的复合函数,即为叉乘。

全匹配

在这里插入图片描述

最大池化匹配

在这里插入图片描述

注意力匹配

在这里插入图片描述
在这里插入图片描述

最大注意力匹配

在这里插入图片描述

模型整体结构

实验设置及结果分析

【说明】设计实验远比做实验难,看别人论文中的实验,这些实验设置能不能用到自己的课题中呢?

参数设置

实验分析

视角数探究:
l越大,视角数越多,模型精确率越高
在这里插入图片描述
作者没有找到视角数达到最高的点。肯定不会一直往上长的,当视角数过大时,模型效率必然会下降。如果在做最佳超参数的实验时,一定要在结果图中凸显出最值。
消融实验:
在这里插入图片描述
Quora实验:
在这里插入图片描述
SNLI实验 & QA实验:
在这里插入图片描述

论文总结

创新点/启发点:

标签:Multi,匹配,Bilateral,特征,视角,双向,Natural,LSTM,向量
来源: https://blog.csdn.net/Ying_M/article/details/118478856