没有合适的资源?快使用搜索试试~ 我知道了~
tacotronv2_wavernn_chinese:tacotronV2 + wavernn 实现中文语音合成(Tensorf...
共94个文件
py:56个
wav:17个
txt:4个
需积分: 46 20 下载量 15 浏览量
2021-04-14
09:30:59
上传
评论 2
收藏 158.96MB ZIP 举报
温馨提示
TacotronV2 + WaveRNN update at 2020-10-3 添加微调分支 开源中文语音数据集(女声)训练中文,实现中文到声学特征(Mel)转换的声学模型。在GTA模式下,利用训练好的TacotronV2合成标贝语音数据集中中文对应的Mel特征,作为声码器的训练数据。在合成阶段,利用TactornV2和WaveRNN合成高质量、高自然度的中文语音。 从任选一个speaker的语音数据集,微调TacotronV2中的部分参数,实现说话人转换。 Tensorflow serving + Flask 部署TacotronV2中文语音合成服务。 由于中采用Location sensitive attention,对长句字的建模能力不好(漏读、重复),尝试了、、,能有效地解决对长句的建模能力,加快模型收敛速度。 tensorflow-gpu的版本为1.14.0 测试语音合成的效果
资源推荐
资源详情
资源评论
收起资源包目录
tacotronv2_wavernn_chinese-master.zip (94个子文件)
tacotronv2_wavernn_chinese-master
logs_wavernn
checkpoints
latest_optim.pyt 36.21MB
latest_weights.pyt 18.14MB
.gitignore 2KB
images
website.png 163KB
post_result.png 102KB
requirements.txt 318B
wavernn_hparams.py 2KB
website
app
plot.py 684B
templates
index.html 4KB
__init__.py 70B
views.py 4KB
tensorflow_grpc.py 1021B
text_to_pyin.py 7KB
audio.py 3KB
text.py 2KB
run.py 71B
README.md 1KB
logs-Tacotron-2
taco_pretrained
tacotron_model.ckpt-206500.meta 4.31MB
tacotron_model.ckpt-206500.index 10KB
tacotron_model.ckpt-206500.data-00000-of-00001 59.09MB
checkpoint 109B
.DS_Store 6KB
tacotron_synthesize.py 10KB
tacotron_hparams.py 19KB
tacotron_preprocess.py 5KB
README.md 8KB
tacotron_model_export.py 2KB
demo
04-forward-griffin_lim-speaker-adaptive.wav 18.27MB
04-graves-griffin_lim.wav 20.68MB
03-forward-griffin_lim-speaker-adaptive.wav 178KB
03-graves-griffin_lim.wav 180KB
03-forward-wavernn.wav 346KB
04-forward-griffin_lim.wav 17.24MB
03-forward-griffin_lim.wav 173KB
demo.html 386B
05-forward-griffin_lim.wav 442KB
01-graves-griffin_lim.wav 711KB
02-forward-griffin_lim-speaker-adaptive.wav 896KB
D8_766.mp3 32KB
02-graves-griffin_lim.wav 1MB
README.md 8KB
01-forward-griffin_lim-speaker-adaptive.wav 670KB
05-forward-wavernn.wav 883KB
01-forward-wavernn.wav 1.29MB
02-forward-griffin_lim.wav 845KB
02-forward-wavernn.wav 1.65MB
01-forward-griffin_lim.wav 663KB
wavernn
models
fatchord_version.py 15KB
deepmind_version.py 7KB
utils
checkpoints.py 5KB
__init__.py 4KB
dsp.py 3KB
distribution.py 5KB
paths.py 1KB
dataset.py 4KB
display.py 3KB
files.py 224B
wavernn_train.py 6KB
tacotron_train.py 3KB
tacotron
datasets
preprocessor.py 5KB
audio.py 12KB
models
tacotron_gmm.py 15KB
graves_attention.py 5KB
__init__.py 174B
tacotron.py 16KB
gmm_attention.py 3KB
location_sensitive_attention.py 10KB
Architecture_wrappers_gmm.py 10KB
custom_decoder.py 5KB
Architecture_wrappers.py 10KB
forward_attention.py 11KB
attention.py 11KB
modules.py 18KB
helpers.py 8KB
synthesize.py 5KB
utils
plot.py 3KB
__init__.py 444B
symbols.py 1KB
cleaners.py 2KB
numbers.py 2KB
cmudict.py 2KB
text.py 3KB
infolog.py 1KB
pinyin
parse_text_to_pyin.py 7KB
pinyin.txt 898KB
large_pinyin.txt 8.37MB
synthesizer.py 6KB
feeder.py 7KB
train.py 11KB
wavernn_gen.py 5KB
wavernn_preprocess.py 6KB
index.html 14KB
train.txt 1.93MB
read_checkpoint.py 531B
共 94 条
- 1
资源评论
邱笑晨
- 粉丝: 44
- 资源: 4553
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功