其他分享
首页 > 其他分享> > 歌声合成方法和工具总结1

歌声合成方法和工具总结1

作者:互联网

主流的方法

  1. tacotron + wavenet=tacotron2
    1. demo:https://colab.research.google.com/github/r9y9/Colaboratory/blob/master/Tacotron2_and_WaveNet_text_to_speech_demo.ipynb

5.声码器
1. world
1. github地址:https://github.com/r9y9/wavenet_vocoder
2.world主要提取提取pitch音高(基频,F0)、谐波谱包络线、非周期谱包络线

音频特征提取工具包librosa

  1. 音乐信息检索(Music information retrieval,MIR)
  2. 应用方向
目前MIR的商业应用主要包括:

1. 推荐系统
目前音乐推荐的应用很多,但很少是基于MIR技术实现的,现在主流技术是通过人工标记或者用户的评论以及收听历史等简介数据进行分类判断,进而实现推荐,但事实上不同音乐本身的相似性是很多的
2. 轨道分离及乐器识别
实现音乐的轨道分离,以及从音乐中识别出是何种乐器在演奏
3. 自动录音
根据音乐自动转换成MIDI文件或者乐谱
4. 音乐分类
根据音乐的产地、艺术家身份、音乐节奏等特征,借助机器学习方法进行5. 音乐分类
6. 自动生成音乐
利用数据库训练模式,让机器自主创造音乐
* [参考维基百科]
  1. librosa 核心代码【* 参考librosa官方文档*]
    3.1 音频信号提取

3.4 时间和频率转化

3.5 音高和曲调

3.9 节奏特征

WaveNet vocoder

    1. github地址
    2.博客:https://r9y9.github.io/wavenet_vocoder/

标签:总结,hop,sr,合成,fft,db,转化,length,歌声
来源: https://blog.csdn.net/weixin_32393347/article/details/88630331