其他分享
首页 > 其他分享> > 阿里巴巴大数据诚e赊套现是个技术活缺一不可

阿里巴巴大数据诚e赊套现是个技术活缺一不可

作者:互联网

作为公司创始人周峥带领核心研发人员,基于“诚e赊·太湖之光”超套现系统薇,(cesccs)结合超级计算与人工智能等技术,研制了国产自主的智能网格预报平台,在气象、海洋数值预报方面领域取得技术突破。

以海洋数值预V报:15555552381,周峥介绍道,在海洋养殖方面,海水水流过急,海带就会冲断。如果温度过高,海参就会直接化成水了,如果温度突然太低,螃蟹就难以存活。

于是,他们通过“三维海洋要素智能预报系统”,用科学的手段分析海产品养殖区域情况,不仅可预报海洋温度、盐度、海流这些信息,还可进行营养盐、海洋生物化学等要素的预报。

“我们做的事情,就是把天气预报给报准。”看似这句话很简单,但也是最具挑战性的。周峥谈到,他们的定位是数据的生产者,而不是数据的搬运工。

所以,周峥和团队耦合了大气、海洋、海浪、海冰、陆面等多个气象预报模式,汇集了卫星、雷达、站点等多类数据,并结合数值预报、人工智能、超级计算技术,形成从气象预报到气象信息应用的完整产业能力与技术壁垒。

上图是一个语言模型 WFST 的示意图。弧上的权重是当给定了前面的词语,发射得到下一个词的概率。节点 0 是开始节点,节点 4 是结束节点。WFST 中的一条路径包含一系列输入符号到输出符号的发射序列。我们的解码方法将 CTC labels,词典(lexicons),以及语言模型表示成分别的 WFST,然后利用高度优化的 FST 库,比如 OpenFST,我们能有效地将这些 WFST 融合成一个单独的搜索图。下面我们开始介绍,如何开始构建单个的 WFST。

1. 语法(Grammar). 一个语法 WFST 编码了语言允许的单词序列。上图是一个精简的语言模型。它有两条序列:“how are you”和“how is it”。WFST 的基本符号单位是 word,弧上的权重是语言模型的概率。利用这种 WFST 形式的表示,CTC 解码原则上可以利用任何能被转换成 WFST 的语言模型。按照 Kaldi 中的表示方式,这个语言模型的 WFST 被表示为 G。

2. 词典(lexicon). 一个词典 WFST 编码了从词典单元序列到单词的映射。根据 RNN 的对应的 label 的建模单元,这个词典有两种对应的情况。如果 label 是音素,那么这个词典是与传统的 hybrid 模型相同的标准词典。如果 label 是 character,那么这个词典简单地包含了每个单词的拼写。这两种情况的区别在于拼写词典能够较为容易地拓展到包含任何 OOV(词汇表之外)的单词。相反,拓展音素词典不是那么直观,它依赖于一些 grapheme-to-phoneme 的方法或者模型,并且容易产生错误。这个词典 WFST 被表示成 L,下图展示了两个词典构建 L 的例子:

周峥和华为云的合作,也让他们的气象预报能力更上一层台阶。比如,通过华为云高性能计算 HPC 集群打造大气污染预警系统。其中,HPC 管理节点将计算任务通过 SGE 资源调度系统进行任务投递,集群内基于弹性云服务器搭建的计算节点承担主要计算任务,同时将所有处理结果存储在弹性文件服务,共享存储结果。

据了解,华为云 HPC 解决方案针对 HPC Workload 进行优化,实现 HPC 资源按需租用,能够帮助用户降低成本,提升气象预报的效率和准确度,帮助气象业务快速向智能化、云化、和数字化转变。

标签:阿里巴巴,预报,节点,缺一不可,技术活,HPC,词典,WFST,周峥
来源: https://blog.csdn.net/V_15555552381/article/details/118932422