没有合适的资源?快使用搜索试试~ 我知道了~
mongolian-speech-recognition:使用PyTorch进行蒙古语语音识别
共40个文件
py:32个
txt:2个
gitignore:2个
需积分: 9 2 下载量 104 浏览量
2021-05-04
08:16:25
上传
评论
收藏 47KB ZIP 举报
温馨提示
使用蒙古专有数据集(WER 8%)进行培训的在线演示: : 。 在此仓库中,实现了以下论文: 语音识别作为光学字符识别 此仓库部分基于: 来自解码器 Jasper / QuartzNet模块 训练 使用conda安装PyTorch> = 1.3 安装剩余的依赖项: pip install -r requirements.txt 下载蒙古圣经数据集: cd datasets && python dl_mbspeech.py 预先计算Mel频谱图: python preprop_dataset.py --dataset mbspeech 火车: python train.py --model crnn --max-epochs 50 --dataset mbspeech --lr-warmup-steps 100 TensorBoard的日志保存在文件夹logdir 结果 在训
资源推荐
资源详情
资源评论
收起资源包目录
mongolian-speech-recognition-master.zip (40个子文件)
mongolian-speech-recognition-master
models
tiny_wav2letter.py 2KB
tiny_jasper.py 2KB
__init__.py 181B
layers.py 1KB
crnn.py 3KB
quartznet
jasper_block.py 11KB
jasper_encoder_decoder.py 6KB
__init__.py 67B
quartznet.py 6KB
eval.py 6KB
misc
lr_policies.py 742B
optimizers.py 9KB
__init__.py 0B
record_and_transcribe.py 2KB
transcribe.py 4KB
utils.py 3KB
train.py 19KB
swa.py 5KB
docker
Dockerfile 388B
requirements.txt 91B
launch_docker.sh 261B
requirements.txt 23B
.gitignore 216B
README.md 3KB
decoder.py 8KB
datasets
transforms.py 10KB
kazakh335h 39B
german_speech.py 2KB
colored_noise.py 2KB
kazakh335h_speech.py 2KB
__init__.py 154B
bolor_speech.py 1KB
mb_speech.py 2KB
libri_speech.py 2KB
.gitignore 84B
collate.py 1KB
kazakh78h_speech.py 2KB
dl_mbspeech.py 4KB
background_sounds.py 2KB
preprop_dataset.py 3KB
共 40 条
- 1
资源评论
PeterLee龍羿學長
- 粉丝: 29
- 资源: 4634
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功