其他分享
首页 > 其他分享> > TTS前端数据预处理

TTS前端数据预处理

作者:互联网

TTS 数据预处理


一个好的语音合成,前端预处理过程至关重要, 因此作为语音合成的开篇之作应该具体说说前端预处理模块及其具体操作过程

  1. 文本正则化
    通过正则表达式,或者规则,或者人工标注,将不规则的文本转化为规则的文本的过程,利用特殊标点符号的处理,数字处理,以及单位,分数,比分的处理等,本节主要说数据预处理因此,具体要根据音频如何读取来正则化文本,期间可以借助ASR来辅助处理,具体不做具体阐述
    本部分其实本质是歧义消除的过程,比如数字 1234, 可以读一二三四,幺二三四,或者一千两百三十四等,但是如果有音频,则读法是固定的,可以将其转化为具体音频读取的中文读法,避免后续处理出错

  2. 音频正则化

    1. 1 包含音频曾则化,
    2. 2 音频两边静音切除等
  3. 文本语音对齐

  4. 韵律标记

  5. 转音素

未完待续

标签:TTS,前端,处理,正则,具体,文本,预处理,音频
来源: https://www.cnblogs.com/wuzhitj/p/16521973.html