首页 > 其他分享> > NLP（第二章）— 机器翻译

NLP（第二章）— 机器翻译

2022-03-03 15:30:24 作者：互联网

前言

从这一部分开始我们将进入到NLP的具体任务环节，首先我们来讲解下机器翻译任务。

一、机器翻译简介

1. 任务定义

机器翻译任务旨在将文本从一种源语言 (Source Language) 翻译到另一种目标语言 (Target Language)。

2. 发展历史

机器翻译的发展历史包括以下四个阶段：基于规则的机器翻译 (Rule-Based Machine Translation, RBMT)；基于实例的机器翻译 (Example-Based Machine Translation, EBMT)；统计机器翻译 (Statistical Machine Translation, SMT)；神经机器翻译 (Neural Machine Translation, NMT)。
我们在这里主要简单介绍下前两种，即RBMT和EBMT。SMT和NMT我们将在后续做更详细的介绍。
RBMT：顾名思义，基于规则，那么规则就需要人来手动编写，所以就会存有设计复杂，不全面等一系列不足。
EBMT：主要思想是通过实例类比对于短语片段进行翻译。举例来讲：我们知道“我爱吃苹果”可以翻译为“I like eat apple”，在翻译“我爱吃桃子”的时候可以直接将“apple”替换为“peach”就可以。这样做在一定程度上减少了规则的定义。

二、统计机器翻译

统计机器翻译的核心思路是：从数据中学习一个概率模型。优化目标则是概率最大时候的目标语言。

1. 翻译模型和语言模型

在引出翻译模型和语言模型前，我们先给出概率模型的形式化定义，如下：
以中英翻译为例，公式中 x x x代表给定的中文句子， y y y代表所有可能对应的英文翻译。 a r g m a x y argmax_y argmaxy是代表的是取最大的概率。整个目标函数是找到最优的 y y y使得 P P P最大。

然后使用贝叶斯公式将上式展开，得到两个需要分别学习的模型。如下所示，其中 P ( X ) P(X) P(X) 不随 y y y改变，故可省略。
在这里插入图片描述
在上式中有两个模型（或者可以称之为有两个概率需要被计算），即： P ( x ∣ y ) P(x|y) P(x∣y) 和 P ( y ) P(y) P(y) 。
• P ( x ∣ y ) P(x|y) P(x∣y) 被称作翻译模型，代表的意义是从平行语料中学习单词和短语如何被正确翻译。
• P ( y ) P(y) P(y) 被称作语言模型，代表的意义是从单语语料中学习如何生成流畅的英语。

除此之外，还有$argmax_y$需要被计算。一种计算方案：枚举所有可能的 标签：NLP,翻译,概率,模型,机器翻译,解码器,第二章,解码	

来源： https://blog.csdn.net/weixin_45282711/article/details/123244688