其他分享
首页 > 其他分享> > 自然语言处理NLP星空智能对话机器人系列:深入理解Transformer自然语言处理 Training a GPT-2 language model

自然语言处理NLP星空智能对话机器人系列:深入理解Transformer自然语言处理 Training a GPT-2 language model

作者:互联网

自然语言处理NLP星空智能对话机器人系列:深入理解Transformer自然语言处理 Training a GPT-2 language model

目录

GPT模型简介

5000亿标记论文:https://arxiv.org/pdf/2005.14165.pdf
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

通用爬网(Common Crawl):https://commoncrawl.org/
在这里插入图片描述

在这里插入图片描述

聊天机器人: GPT-3能够继续进行类似人类的对话,使其成为理想的聊天机器人,并且已经编写了许多GPT-3聊天机器人,仍有潜力改进当今的聊天机器人。无需针对具体案例进行预训练;它能够翻译,回答抽象的问题,并作为一个搜索引擎与确切的答案,包括源链接。
https://research.aimultiple.com/chatbot/
在这里插入图片描述

在这里插入图片描述

自动完成:GPT-3是为自动完成而构建的,是最人性化的系统,正如IDEO团队所解释的那样,他们将GPT-3用作头脑风暴的合作伙伴。

在这里插入图片描述

GPT-3源代码仍然是私有的,用户只能使用黑盒API进行实验,GPT-3与人工通用智能(AGI)相去甚远。它能够理解语言的结构,将单词按正确、自然的发音顺序排列,这是一项伟大的成就。然而,它缺乏对词义的理解,因此可能产生无意义或错误的陈述。

GPT-4的下一步是什么?

就训练数据规模和处理能力而言,GPT-3是最先进的NLP系统。埃隆·马斯克说:“从最初的GPT到GPT-3的改善速度令人印象深刻。如果这种改善速度继续下去,GPT-5或6可能无法与最聪明的人类区分开来。”。我们对此感到乐观。

尽管OpenAI在创建类人语言方面取得了重大进展,但在创建具有逻辑推理能力的模型方面几乎没有取得任何进展。商业应用很难依赖没有逻辑推理的模型。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Training a GPT-2 language model

我们将在自定义数据集上训练GPT-2模型, 然后将与定制的模型交互。使用training_OpenAI_GPT_2.ipynb

Step 1: Prerequisites

先决条件 :

标签:NLP,Transformer,星空,机器人,GPT,自然语言
来源: https://blog.csdn.net/duan_zhihua/article/details/120678518