其他分享
首页 > 其他分享> > 斯坦福NLP课程 | 第12讲 - NLP子词模型

斯坦福NLP课程 | 第12讲 - NLP子词模型

作者:互联网

ShowMeAI研究中心


子词模型
ShowMeAI斯坦福CS224n《自然语言处理与深度学习(Natural Language Processing with Deep Learning)》课程的全部课件,做了中文翻译和注释,并制作成了GIF动图!视频和课件等资料的获取方式见文末


引言

子词模型subword models

授课计划

授课计划

1.语法学基础知识

1.1 人类语言的声音:语音学和语音体系

人类语言的声音:语音学和语音体系

1.2 词法:词类

词法:词类

\[\left[\left[\text {un}\left[[\text { fortun }(\mathrm{e})]_{\text { Root }} \text { ate }\right]_{\text { STEM }}\right]_{\text { STEM }} \text {ly}\right]_{\text { WORD }} \]

词法

1.3 书写系统中的单词

书写系统中的单词

1.4 比单词粒度更细的模型

比单词粒度更细的模型

1.5 字符级模型

字符级模型

1.6 单词之下:书写系统

单词之下:书写系统

2.基于字符粒度的模型

2.1 纯字符级模型

纯字符级模型

2.2 字符级别输入输出的机器翻译系统

字符级别输入输出的机器翻译系统

2.3 English-Czech WMT 2015 Results

English-Czech WMT 2015 Results

English-Czech WMT 2015 Results

2.4 无显式分割的完全字符级神经机器翻译

无显式分割的完全字符级神经机器翻译

2.5 #论文解读# Stronger character results with depth in LSTM seq2seq model

#论文解读#

3.子词模型

3.1 子词模式:两种趋势

子词模式:两种趋势

3.2 字节对编码/BPE

字节对编码/BPE

字节对编码

字节对编码

字节对编码

3.3 Wordpiece / Sentencepiece模型

Wordpiece / Sentencepiece模型

Wordpiece / Sentencepiece模型

Wordpiece / Sentencepiece模型

3.4 字符级构建单词级

字符级构建单词级

3.5 基于字符的LSTM构建单词表示

基于字符的LSTM构建单词表示

3.6 #论文解读# Character-Aware Neural Language Models

#论文解读#

#论文解读# Technical Approach

#论文解读# Convolutional Layer

#论文解读# Highway Network (Srivastava et al. 2015)

#论文解读# Long Short-Term Memory Network

#论文解读# Quantitative Results 定量结果

#论文解读# Qualitative Insights 定量洞察

#论文解读# Qualitative Insights 定量洞察

#论文解读#

4.混合字符与词粒度的模型

4.1 混合NMT

混合NMT

混合NMT

4.2 二级解码

二级解码

补充讲解

4.3 English - Czech Results

English - Czech Results

4.4 Sample English-czech translations

Sample English-czech translations

4.5 单词嵌入中的字符应用

单词嵌入中的字符应用

5.fastText模型

FastText embedding

FastText embedding

\[where =,where =<wh,whe,her,ere,re>,<where> \]

\[S(w, c)=\sum g \in G(w) \mathbf{Z}_{g}^{\mathrm{T}} \mathbf{V}_{C} \]

FastText embedding

FastText embedding

Suggested Readings

6.视频教程

可以点击 B站 查看视频的【双语字幕】版本

7.参考资料

ShowMeAI系列教程推荐

NLP系列教程文章

斯坦福 CS224n 课程带学详解

ShowMeAI用知识加速每一次技术成长

标签:NLP,12,字符,模型,斯坦福,单词,课程,子词
来源: https://www.cnblogs.com/showmeai/p/16277223.html