其他分享
首页 > 其他分享> > OfficialKaldi(一)| 关于Kaldi项目(翻译注解)

OfficialKaldi(一)| 关于Kaldi项目(翻译注解)

作者:互联网

 

什么是Kaldi?

Kaldi是使用C ++编写的语音识别工具包,并根据Apache License v2.0获得许可。Kaldi供语音识别研究人员使用。有关更详细的历史记录和贡献者列表,请参见Kaldi项目的历史记录

 

卡尔迪(Kaldi)这个名字

根据传说,卡尔迪是埃塞俄比亚的牧羊人,发现了咖啡植物。

 

Kaldi与其他工具箱

Kaldi的目标和范围与HTK相似。目标是拥有易于修改和扩展的用C ++编写的现代而灵活的代码。重要功能包括:

 

 

 

 

 

发布完整食谱的目标是Kaldi的重要方面。由于该代码是根据允许修改和重新发布的许可证公开提供的,因此,我们鼓励人们以与Kaldi自己的示例脚本类似的格式发布其代码以及脚本目录。

在给定时间限制的情况下,我们试图使Kaldi的文档尽可能完整,但是短期内我们不希望生成与HTK一样详尽的文档。特别是,HTKBook中有很多入门材料,它们为未入门者介绍了统计语音识别,这可能永远不会出现在Kaldi的文档中。Kaldi的许多文档都是以这样的方式编写的,即只有专家才能使用。考虑到我们的目标受众是语音识别研究人员或培训中的研究人员,将来我们希望使其更易于使用。通常,Kaldi并不是用于“假人”的语音识别工具包。它将允许您执行许多没有意义的操作。

 

卡尔迪的味道

在本节中,我们尝试总结Kaldi工具包的一些更通用的品质。在某种程度上,这描述了当前开发人员的目标,并描述了项目的当前状态。这并不意味着排除工作风格不同的研究人员的贡献。

 

 

 

 

 

 

 

项目状况

当前,我们拥有用于大多数标准技术的代码和脚本,包括所有标准线性变换,MMI,增强型MMI和MCE判别训练,以及特征空间判别训练(例如fMPE,但基于增强型MMI)。我们为《华尔街日报》和《资源管理》以及《总机》提供了工作食谱。由于词汇和语言模型问题,“配电盘”配方尚未提供最新的结果–为此,我们不使用任何外部数据源。

注意:在我们打算将版本号用于Kaldi的主要发行版(“ v1”等)的早期阶段之后,我们意识到这些类型的发行版与自然的开发风格不太吻合,这是非常连续的。当前,我们仅维护“ master”开发分支,这是您应该使用的版本。另外,经常执行“ git pull”以保持其最新状态。有关更多详细信息,请参见下载和安装Kaldi

 

参考论文中的Kaldi

如果您想在论文中引用Kaldi,可以使用以下参考。

 
 

@INPROCEEDINGS { Povey_ASRU2011, 作者= {Povey,Daniel和Ghoshal,Arnab和Boulianne,Gilles和Burget,Lukas和Glembek,Ondrej和Goel,Nagendra和Hannemann,Mirko和Motlicek,Petr和Qian,Yanmin和Schwarz,Petr和Silovsky,Jan和Stemmer,Georg还有Vesely,Karel}, 关键字= {ASR,自动语音识别,GMM,HTK,SGMM}, 月=十二月 title = {卡尔迪语音识别工具包}, booktitle = {IEEE 2011自动语音识别和理解研讨会”, 年= {2011}, 发布者= {IEEE信号处理协会}, 位置= {美国夏威夷大岛希尔顿唯客乐渡假村}, note = {IEEE目录号:CFP11SRW-USB}, }

 

标签:OfficialKaldi,代码,Kaldi,工具包,语音,注解,配方,我们
来源: https://blog.csdn.net/qq_42734492/article/details/110506941