没有合适的资源?快使用搜索试试~ 我知道了~
DurIAN:“用于多模式合成的持续时间通知注意网络”的实现(https
共43个文件
py:32个
txt:3个
md:2个
需积分: 5 0 下载量 136 浏览量
2021-03-31
19:22:58
上传
评论
收藏 3.65MB ZIP 举报
温馨提示
榴莲 实施“多模式合成的持续时间知悉网络”( )。 状态:已发布 1个信息 DurIAN是用于文本到语音合成任务的编码器-解码器体系结构。 与Tacotron 2等以前的体系结构不同,它不学习注意力机制,而是考虑音素持续时间信息。 因此,当然,要使用此模型,应具有音素化和持续时间对齐的数据集。 但是,您可以尝试在LJSpeech数据集(使用CMU dict)上使用预训练的持续时间模型。 链接将在下面提供。 2架构细节 DurIAN模型包含两个模块:骨干合成器和持续时间预测器。 以下是与论文中描述的Durian最显着的区别: 不使用韵律边界标记(未标记),因此不存在“跳过状态”排除韵律边界的隐藏状态 样式代码也未使用(相同原因) 在CBHG编码器之前删除了Prenet(在实验过程中没有提高准确性) 解码器的循环单元一次输出单个频谱图帧 骨干合成器和持续时间模型都可以同时训练。
资源推荐
资源详情
资源评论
收起资源包目录
DurIAN-master.zip (43个子文件)
DurIAN-master
.gitignore 2KB
README.md 6KB
text
text_frontend.py 4KB
__init__.py 40B
tests
base.py 7KB
test_baseline_backward_pass.py 2KB
test_default_backward_pass.py 2KB
test_data_loading.py 13B
test_baseline_forward_pass.py 756B
test_default_forward_pass.py 715B
logger.py 1KB
configs
default.json 1KB
baseline.json 1KB
train.py 4KB
LICENSE 1KB
trainer.py 5KB
inference.py 2KB
model
base.py 1KB
baseline.py 4KB
alignment.py 1KB
utils.py 327B
decoder.py 5KB
model.py 4KB
encoder.py 6KB
__init__.py 63B
duration.py 3KB
prenet.py 649B
layers.py 2KB
postnet.py 1KB
utils.py 801B
requirements.txt 41B
filelists
train_filelist.txt 8.83MB
valid_filelist.txt 71KB
torchaudio
README.md 979B
stft.py 6KB
autils.py 2KB
vocoders.py 724B
__init__.py 0B
mel.py 3KB
loss.py 3KB
data.py 5KB
demo
baseline.png 321KB
demo.wav 162KB
共 43 条
- 1
资源评论
giao金
- 粉丝: 31
- 资源: 4604
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 50R4 R5 K8 X4 ECHO 55K8 58R5 58X原理图.pdf
- “人力资源+大数据+薪酬报告+涨薪调薪”
- “人力资源+大数据+薪酬报告+涨薪调薪”
- 牙齿图像分割-基于2D全景图像的牙齿分割算法实现-附项目源码-优质项目分享.zip
- 亚马逊爬虫抓取商品信息并数据分析.zip
- 基于MATLAB的车牌识别系统
- 海信智能电视刷机数据 LED40K160JD(0002)BOM3 生产用软件数据 务必确认机编一致 强制刷机 整机USB升级程序
- 【STL源码剖析】deque 的使用
- 车辆综合管控平台.zip
- 海信智能电视刷机数据 LED40K160JD(0000)BOM1 生产用软件数据 务必确认机编一致 强制刷机 整机USB升级程序
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功