首页 > TAG信息列表 > AIBigKaldi

AIBigKaldi(十七)| Kaldi的DNN模型(源码解析)

 本文来自公众号“AI大道理”   单音素模型词错误率为50.58%,三音子模型词错误率为36.03%,lda-mllt模型词错误率为32.12%,说话人自适应模型词错误率为28.41%,quick模型词错误率为27.94%。 可见quick模型识别率继续有了一定的提高。   能否继续优化模型?又要从哪些方面入手进行优化呢

AIBigKaldi(九)| Kaldi的解码搜索(源码解析)

本文来自公众号“AI大道理”。   ​ 构建了HCLG解码图后,解码就是在这个图上寻找一条最优路径。 最优路径上去除epsilon后的输出标签序列就是单词级别的识别结果。 (本篇主要解析kaldi源码实现,详细算法原理请阅读: AI大语音(十一)——WFST解码器(上)(深度解析))   1 解码 5 decode.sh

AIBigKaldi(六)| Kaldi的单音子模型训练(下)

 本文来自公众号“AI大道理”。   构造好训练图接下来就可以进行训练了。 所谓训练就是在训练图上进行解码,获得最优路径的同时得到对齐序列,根据对齐序列进行统计信息量。 转移概率可以进行数数获得,GMM参数随着对齐的帧数变化而更新,同时GMM分量从一开始的单高斯split出更多的高