没有合适的资源?快使用搜索试试~ 我知道了~
deepspeech.mxnet:百度DeepSpeech架构的MXNet实现
共31个文件
py:22个
cfg:2个
wav:2个
需积分: 9 0 下载量 195 浏览量
2021-05-18
07:12:14
上传
评论
收藏 215KB ZIP 举报
温馨提示
deepSpeech.mxnet:丰富语音示例 此示例基于可帮助您使用以下方法大规模构建语音转文本(STT)模型 CNN,完全连接的网络,用于网络层的(Bi-)RNN,(Bi-)LSTM和(Bi-)GRU, 批量归一化和辍学以提高培训效率, 以及用于计算损失的经纱CTC。 此外,为了创建自己的STT模型,您只需要编辑配置文件而不是实际代码即可。 动机 本示例旨在指导希望使用MXNet制作实用STT模型的人们。 有了上面解释的丰富功能和便利,您可以比以前的示例更轻松地构建自己的语音识别模型。 环境环境 MXNet版本:0.9.5+ GPU记忆体大小:2.4GB以上 安装张量板进行记录 pip install tensorboard 用于音频预处理的 (如果遇到关于libsndfile的错误,请遵循 。) pip install soundfile 经纱CTC:请按照安装百度的经
资源推荐
资源详情
资源评论
收起资源包目录
deepspeech_mxnet-master.zip (31个子文件)
deepspeech.mxnet-master
Libri_sample
3830-12529-0005.wav 123KB
3830-12531-0030.wav 92KB
default.cfg 3KB
flac_to_wav.sh 219B
main.py 16KB
stt_utils.py 5KB
train.py 7KB
layer
slice.py 329B
warpctc.py 791B
gru.py 11KB
__init__.py 0B
fc.py 10KB
conv.py 565B
batchnorm.py 1KB
lstm.py 15KB
stt_io_iter.py 4KB
stt_bi_graphemes_util.py 1KB
stt_datagenerator.py 12KB
resources
unicodemap_en_baidu.csv 130B
LICENSE 11KB
singleton.py 922B
label_util.py 3KB
arch_deepspeech.py 9KB
stt_io_bucketingiter.py 6KB
config_util.py 3KB
Libri_sample.json 249B
stt_bucketing_module.py 526B
deepspeech.cfg 3KB
README.md 5KB
log_util.py 2KB
stt_metric.py 7KB
共 31 条
- 1
资源评论
TristanDu
- 粉丝: 22
- 资源: 4681
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功