没有合适的资源?快使用搜索试试~ 我知道了~
wavenet-speech-to-text:基于DeepMind的WaveNet的PyTorch语音识别实现
共19个文件
py:9个
pyc:7个
license:1个
需积分: 50 11 下载量 36 浏览量
2021-05-15
07:31:45
上传
评论 1
收藏 216KB ZIP 举报
温馨提示
使用WaveNet进行语音转文字 仍然需要弄清楚CTCLoss的南问题 基于DeepMind论文: 语音识别实现。 此实现的目的是结构合理,可重用且易于理解。 这里的流实现: 尽管WaveNet被设计为“文本到语音”模型,但该论文提到他们也在语音识别任务中对其进行了测试。 他们没有提供有关实现的具体细节,只是表明他们通过直接在TIMIT上对原始音频进行训练的模型在测试数据集上达到了18.8 PER。 我从修改了WaveNet模型,并将的语音识别实验。 下图显示了最终的体系结构。 (图片来源: ) 先决条件 系统 Linux CPU或(NVIDIA GPU + CUDA CuDNN) Python 3.6 图书馆 PyTorch = 0.4.0 librosa = 0.5.0 熊猫> = 0.19.2 == 0.11.0 数据集 我们使用了 , 和语料库。 由上
资源推荐
资源详情
资源评论
收起资源包目录
wavenet-speech-to-text-master.zip (19个子文件)
wavenet-speech-to-text-master
train.py 6KB
utils
exceptions.py 374B
data.py 1KB
.~data.py 0B
__pycache__
exceptions.cpython-36.pyc 694B
decoder.cpython-36.pyc 7KB
data_loader.cpython-36.pyc 3KB
data.cpython-36.pyc 2KB
preprocess.py 8KB
data_loader.py 3KB
decoder.py 8KB
log
architecture.png 187KB
model
__pycache__
deepspeech.cpython-36.pyc 9KB
networks.cpython-36.pyc 8KB
wavenet.cpython-36.pyc 4KB
wavenet.py 4KB
networks.py 8KB
LICENSE 1KB
README.md 3KB
共 19 条
- 1
资源评论
孙洋Sonya
- 粉丝: 28
- 资源: 4633
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功