GLUE Dataset

2021-11-27 13:34:51 作者：互联网

GLUE Dataset

1. XNLI

Multi-Genre Natural Language Inference(Cross-lingual),跨语言的自然语言推断，huggingface-xnli-zh-train部分在线示例。
判断premise是否被hypothesis蕴含。label：neutral, entailment蕴含,contradiction矛盾.分类任务.
训练集zh部分示例

2.QQP

Quora Question Pairs来自Quora的两个问题句子是否一致,一致标记为duplicate，不一致:not_duplicate.判断两个句子是否意思一样。二分类任务.
huggingface-QQP-train部分在线示例
QQP

3.QNLI

Question Natural Langiage Inference判断sentence是否包含question的答案.包含:entailment。二分类任务

QNLI 在线示例

QNLI

4.SST-2

SST-2 - Stanford Sentiment Treebank Stanford情感任务,判断句子是正向还是负向的。

SST-2在线示例
SST-2

5.CoLA

CoLA - Corpus of Linguistic Acceptability 判断句子语法是否正确。正确:acceptable.
CoLA

6.STS-B

Semantic Textual Similarity Benchmark ：判断两个句子语义相似度，label:0-5浮点数。本质是回归任务，可以转换为5分类任务。

STS-B

7.MRPC

Microsoft Research Paraphrase Corpus判断两个句子语义是否相等.label:equivalent相等。
MRPC

8.RTE

Recognizing Textual Entailment: RTE也是文本蕴含任务，不同MNLI的3分类，它是2分类。not_entailment/entailment。

RTE

9.WNLI

Winograd NLI文本蕴含任务，2分类。
WNLI

标签：entailment,示例,SST,分类,Dataset,任务,GLUE,句子
来源： https://blog.csdn.net/weixin_39754630/article/details/121550843