AIBigKaldi

首页 > TAG信息列表 > AIBigKaldi

AIBigKaldi（十七）| Kaldi的DNN模型（源码解析）

本文来自公众号“AI大道理” 单音素模型词错误率为50.58%，三音子模型词错误率为36.03%，lda-mllt模型词错误率为32.12%，说话人自适应模型词错误率为28.41%，quick模型词错误率为27.94%。可见quick模型识别率继续有了一定的提高。能否继续优化模型？又要从哪些方面入手进行优化呢

AIBigKaldi（九）| Kaldi的解码搜索（源码解析）

本文来自公众号“AI大道理”。构建了HCLG解码图后，解码就是在这个图上寻找一条最优路径。最优路径上去除epsilon后的输出标签序列就是单词级别的识别结果。（本篇主要解析kaldi源码实现，详细算法原理请阅读： AI大语音（十一）——WFST解码器（上）（深度解析）） 1 解码 5 decode.sh

AIBigKaldi（六）| Kaldi的单音子模型训练（下）

本文来自公众号“AI大道理”。构造好训练图接下来就可以进行训练了。所谓训练就是在训练图上进行解码，获得最优路径的同时得到对齐序列，根据对齐序列进行统计信息量。转移概率可以进行数数获得，GMM参数随着对齐的帧数变化而更新，同时GMM分量从一开始的单高斯split出更多的高