其他分享
首页 > 其他分享> > 不再隐瞒了,训练千亿参数模型的法宝,告诉你们

不再隐瞒了,训练千亿参数模型的法宝,告诉你们

作者:互联网

摘要:盘古的训练以「昇腾AI处理器」为基座,同时借助了「CANN 异构计算架构」,让硬件算力得以充分释放,大大缩短了训练时间!

2021年4月,“华为云盘古大模型”一炮走红AI人工智能领域。如果你问:明明明明明白白白喜欢他,但他就是不说,白白喜欢谁?你的同伴可能还要犹豫3秒钟,而盘古却能轻松地回答出:明明!诸如此类的「中文同词不同义」的快速语义识别也仅仅是它的雕虫小技而已。领先的语言理解和模型生成能力,这个大网红瞬间被贴上了“最接近人类中文理解能力”、“全球最大中文语言(NLP)预训练模型”各类标签。标签不是白帖的,在AI领域,大智慧就意味着大模型,他背后的“千亿参数”、“TB 级内存模型”绝对是他成功的法宝!模型大,意味着数据也大,你想到如何训练出这样大的模型了么?盘古的训练以「昇腾AI处理器」为基座,同时借助了「CANN 异构计算架构」,让硬件算力得以充分释放,大大缩短了训练时间!

什么是CANN?

以提升用户开发效率和释放昇腾AI处理器极致算力为目标,昇腾CANN(Compute Architecture for Neural Networks)是华为针对AI场景推出的异构计算架构。它对上支持业界主流前端框架,向下对用户屏蔽系列化芯片的硬件差异,以丰富的软件栈功能满足用户全场景的人工智能应用诉求。

当前CANN已经发布到3.0的版本,统一编程架构,同时支持推理+训练的端、边、云全量场景,实现三大使能。

使能全场景:通过支持业界主流AI框架,支持14+种主流操作系统,实现一次开发,全场景各种硬件形态和运行环境的灵活部署。

使能极简开发:通过统一编程接口AscendCL(Ascend Computing Language),为开发者屏蔽底层处理器的差异,支持开发者只需要掌握一套API,就可以全面应用于昇腾全系列芯片+推理、训练全场景。

使能极致性能:通过软硬协同优化,亲和昇腾的图编译技术,以及超过1200个高性能算子,来释放昇腾芯片的澎湃算力。

CANN的开放能力:

CANN为开发者提供算子开发、模型开发、应用开发的全流程开发体验,可覆盖全场景应用。

CANN的硬核技术:

CANN的5.0版本会给你带来更多想象,了解更多信息,请访问昇腾社区

 

点击关注,第一时间了解华为云新鲜技术~

标签:法宝,隐瞒,CANN,模型,AI,开发,千亿,开发者,算子
来源: https://www.cnblogs.com/huaweiyun/p/15210356.html