其他分享
首页 > 其他分享> > TTS实现过程(大白话)

TTS实现过程(大白话)

作者:互联网

实现TTS先了解数据wav文件

不知道童鞋们知不知道scipy这个函数(看,有童鞋举爪了),这个函数实现了读取wav文件的过程,具体是:scipy.io.wavefile这个函数,这个函数读取wav文件之后表现为数组的形式,这样就明了多了,wav文件通过scipy转码成为了数组的形式,同样数组也可以通过scipy.io.wavefile实现存为wav文件。好了,有了对数据的基础认识,接下来聊聊TTS

TTS实现

目前主流的方法大家应该也都了解过是将文字转化为拼音再转化为id,然后通过训练获得模型。浅了浅了,实际上是,文字先转化为拼音,拼音再转化为音素,音素再对应id,id再进行独热编码获得基础特征,后再通过其他的嵌入手段将独热编码稀疏性的缺点抹除,然后再通过构建的模型进行训练,那你可能会说,指导数据呢?前面不是提到了scipy的wav文件读取为数组的方法嘛,你看这不就出来了,文字-->id-->embeding-->model-->通过读取wav的数组指导训练结果

其实往细了讲在进行训练之前还包括数据对齐和数据预处理以及数据归一化,训练之后还包括滤波和声码器合成等操作,确实是一个较难的项目。

标签:大白话,TTS,实现,scipy,数组,wav,--,id
来源: https://blog.csdn.net/qq_34171593/article/details/123119808