没有合适的资源?快使用搜索试试~ 我知道了~
mellotron:梅洛特隆
共42个文件
py:23个
txt:7个
musicxml:3个
需积分: 9 0 下载量 160 浏览量
2021-05-04
15:57:04
上传
评论
收藏 3.25MB ZIP 举报
温馨提示
拉斐尔·瓦莱(Rafael Valle)*,杰森·李(Jason Li)*,瑞安·普伦格(Ryan Prenger)和布莱恩·卡坦扎罗(Bryan Catanzaro) 在我们最近的我们提出了Mellotron:基于Tacotron 2 GST的多扬声器语音合成模型,该模型可以进行语音表情和唱歌,而无需情感或唱歌训练数据。 通过明确地根据音频信号或乐谱中的节奏和连续音高等高线,Mellotron能够生成多种样式的语音,从朗读的语音到富有表现力的语音,从缓慢的抽奖到说唱,从单调的声音到唱歌的声音。 请访问我们的以获取音频样本。 先决条件 NVIDIA GPU + CUDA cuDNN 设置 克隆此仓库: git clone https://github.com/NVIDIA/mellotron.git CD进入此仓库: cd mellotron 初始化子模块: git submod
资源推荐
资源详情
资源评论
收起资源包目录
mellotron-master.zip (42个子文件)
mellotron-master
multiproc.py 647B
distributed.py 7KB
loss_scaler.py 4KB
loss_function.py 673B
waveglow
train.py 11KB
filelists
libritts_speakerinfo.txt 122KB
ljs_audiopaths_text_sid_train_filelist.txt 1.55MB
ljs_audiopaths_text_sid_val_filelist.txt 7KB
libritts_train_clean_100_audiopath_text_sid_shorterthan10s_atleast5min_train_filelist.txt 2.57MB
libritts_train_clean_100_audiopath_text_sid_atleast5min_val_filelist.txt 27KB
data_utils.py 6KB
stft.py 6KB
.gitmodules 86B
hparams.py 4KB
text
cmudict.py 2KB
numbers.py 2KB
__init__.py 3KB
LICENSE 1KB
cleaners.py 2KB
symbols.py 812B
utils.py 1KB
audio_processing.py 3KB
mellotron_logo.png 158KB
model.py 27KB
requirements.txt 155B
inference.ipynb 806KB
modules.py 6KB
LICENSE 1KB
README.md 3KB
mellotron_utils.py 15KB
plotting_utils.py 2KB
layers.py 4KB
data
mozart_requiem_kyrie_satb.musicxml 517KB
example1.wav 172KB
examples_filelist.txt 134B
cmu_dictionary 3.55MB
debussy_prelude_lyrics.musicxml 20KB
example2.wav 104KB
haendel_hallelujah.musicxml 288KB
logger.py 2KB
yin.py 4KB
fp16_optimizer.py 17KB
共 42 条
- 1
资源评论
吉莫吉鱼
- 粉丝: 15
- 资源: 4591
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功