没有合适的资源?快使用搜索试试~ 我知道了~
SC-WaveRNN:扬声器条件WaveRNN的PyTorch官方实现
共29个文件
py:22个
txt:2个
jpg:2个
需积分: 14 0 下载量 16 浏览量
2021-04-23
06:39:53
上传
评论
收藏 114KB ZIP 举报
温馨提示
SC-WaveRNN 扬声器条件WaveRNN:面向看不见的扬声器和录音条件的通用神经声码器 Dipjyoti Paul a ,Yannis Pantazis b和Yannis Stylianou a 克里特岛的计算机科学系,大学 b仪器和计算数学学院,研究和技术基金会-Hellas 抽象的: 深度学习的最新进展导致了单说话者语音合成中人类水平的表现。 但是,当将这些系统推广到多扬声器模型时,尤其是对于看不见的讲话者和看不见的录音质量,在语音质量方面仍然存在局限性。 例如,常规的神经声码器被调整为训练说话者,并且对于看不见的说话者具有较差的泛化能力。 在这项工作中,我们提出了WaveRNN的一种变体,称为说话者条件WaveRNN(SC-WaveRNN)。 我们致力于开发高效的通用声码器,甚至适用于看不见的扬声器和录音条件。 与标准WaveRNN相比,SC-WaveRNN利用以扬声器嵌
资源推荐
资源详情
资源评论
收起资源包目录
SC-WaveRNN-master.zip (29个子文件)
SC-WaveRNN-master
utils
text
cmudict.py 2KB
numbers.py 2KB
__init__.py 2KB
LICENSE 1KB
recipes.py 635B
cleaners.py 2KB
symbols.py 720B
distribution.py 5KB
dataset.py 7KB
__init__.py 0B
display.py 3KB
dsp.py 2KB
paths.py 2KB
files.py 199B
models
tacotron.py 17KB
deepmind_version.py 7KB
fatchord_version.py 15KB
hparams.py 4KB
train_tacotron.py 5KB
gen_tacotron.py 6KB
requirements.txt 62B
assets
Tacotron_spk_embd.jpg 30KB
WaveRNN_spk_embd.jpg 81KB
sentences.txt 463B
README.md 4KB
gen_wavernn.py 5KB
_config.yml 26B
preprocess.py 2KB
train_wavernn.py 4KB
共 29 条
- 1
资源评论
易行健
- 粉丝: 29
- 资源: 4593
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功