自然语言处理概述(前沿、数据集、下游任务)
作者:互联网
自然语言处理
First at all
因为本人换系统 之前都在用oneNote,在ubuntu上部署不便,所以将一些常用的信息写成博客
本文主要引用Ruder大神的 NLP-proress 做了一下翻译和提取
原文地址:传送门
1.前沿技术 State of the Art
机器学习和自然语言处理(NLP)的研究近来发展如此之快,很难跟上。这对于该领域的人来说是一个问题,但对于想要进入NLP的人和那些寻求从教程到复制论文和进行自己研究的人来说,这是一个更大的障碍。如果没有专家指导和先验知识,确定最常见的数据集以及您感兴趣的任务的当前最新技术可能是一个艰苦的过程。
以下是几个本人常用的看state of the art的网站和论文实现以及数据集的网站
- Association of Computation Linguistics(ACL)
- The Electronic Frontier Foundation
- LRE Map
- Semantic Evaluation (SemEval)
- Paper With Code
2.自然语言处理下游任务
2.1 任务列表
- 自动语音识别 ASR
- CCG 组合范畴语法
- Common sense
- 区域解析
- Coreference resolution
- 依赖解析
- 对话
- Domain Sentiment analysis
- 实体链接 EL Entity linking
- 语法纠错
- 信息抽取
- 语言建模
- 词汇规范
- 机器翻译
- 多任务学习
- 多模态
- 命名实体识别
- 自然语言推理
- 词性标注
- QA问答
- 关系预测
- 关系抽取
- 语义文本相似度
- 语义角色标记
- 情感分析
- Shallow syntax
- Simplification
- 姿态检测
- 概要
- 分类学习
- 时间处理
- 文本分类
- 词义消歧WSD
- 中文分词
2.2 个别任务前沿和数据集
-
自动语音识别 ASR
state of the art -
对话 dialog(chatbot)
state of the art -
Domain Sentiment analysis
Multi-Domain Sentiment Dataset -
Machine translation
WMT 2014
BPEmb -
命名实体识别(NER)
CoNLL
关系提取是从文本中提取语义关系的任务。提取的关系通常发生在某种类型的两个或多个实体(例如,人,组织,位置)之间,并且属于许多语义类别(例如,与之结合,被其雇用)
- QA & Reading comprehension 问答和阅读理解
overview - 情感分析
IMDb dataset
Stanford Sentiment Treebank (SST)
SemEval
3 thanks for all
State-of-the-art result for all Machine Learning Problems
NLP-pregress
标签:NLP,Domain,art,Sentiment,state,概述,前沿,自然语言 来源: https://blog.csdn.net/xuan100e/article/details/89544956