其他分享
首页 > 其他分享> > 基于 RTVC-7 Voice Cloning Model 的 Cross-Lingual TTS 的三步走: 第二步 Tuned-GE2E-EarSpeech 不跨语言实验观察

基于 RTVC-7 Voice Cloning Model 的 Cross-Lingual TTS 的三步走: 第二步 Tuned-GE2E-EarSpeech 不跨语言实验观察

作者:互联网

0. 说明

1. 选取 Reference Speech

使用里面的 speaker embedding 的路径, 然后替换为 GE2E 的路径, 其实就多了个后缀, 参与网络预测, 然后用 gl 合成里面的 mel, 作为参考

2. 选取文本

3. Speaker 相似的具体现象

3.1. 急促感

当参考音频比较急促时: speaker id = 2, GE2E 在句末更短促, 效果更好

标签:GE2E,TTS,mel,hujk17,Tuned,ceph,EarSpeech,npy,home
来源: https://blog.csdn.net/u013625492/article/details/114658654