首页 > TAG信息列表 > thchs30

kaldi例子thchs30笔记(二)

数据准备 由于我们已经下载过数据了,直接进行数据准备。 根据注释,我们知道,数据准备就是要产生四个文件分别是text,wav.scp,utt2spk,spk2utt (1)text:音频标注 (2)wav.scp:指定音频路径 (3)utt2spk:音频对应的说话人信息 (4)spk2utt:说话人对应的音频信息 打开s5/local/thchs-30_da

kaldi_thchs30_2 run.sh

run.sh #[ -d $thchs ] || mkdir -p $thchs || exit 1 #echo "downloading THCHS30 at $thchs ..." #local/download_and_untar.sh $thchs http://www.openslr.org/resources/18 data_thchs30 || exit 1 #local/download_and_untar.sh $thchs http://www.opensl

AIBigKaldi(十)| Kaldi的thchs30实例(源码解析)

 本文来自公众号“AI大道理”。      单音子模型的假设是一个音素的实际发音与其左右的音素无关。这个假设与实际并不符合。由于单音子模型过于简单,识别结果不能达到最好,因此需要继续优化升级。就此引入多音子的模型。 最为熟悉的就是三音子模型,即上下文相关的声学模型。 在Ye