# MASR 中文语音识别
**MASR**是一个基于**端到端的深度神经网络**的**中文普通话语音识别**项目。
## 原理
MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构类似于Facebook在2016年提出的Wav2letter。但是使用的激活函数不是`ReLU`或者是`HardTanh`,而是`GLU`(门控线性单元)。因此称作门控卷积网络。根据我的实验,使用`GLU`的收敛速度比`HardTanh`要快。如果你想要研究卷积网络用于语音识别的效果,这个项目可以作为一个参考。
**以下用字错误率CER来衡量模型的表现,CER = 编辑距离 / 句子长度,越低越好**
**大致可以理解为 1 - CER 就是识别准确率。**
模型使用AISHELL-1数据集训练,共150小时的录音,覆盖了4000多个汉字。**工业界使用的语音识别系统通常使用至少10倍于本项目的录音数据来训练,同时使用特定场景的语料来训练语言模型**,所以,不要期待本项目可以和工业界的识别效果媲美。这对于Github上任何个人项目来说都不现实,除非有更先进的技术诞生。
*什么叫特定场景的语料训练的语言模型?比如你使用游戏中的语音识别,它更倾向于将你的话识别成你在玩游戏时可能说的话,比如「貂蝉被蓝打死了」。而在其他场景下,「貂蝉被蓝打死了」根本就不是一句通顺的话。不信你和一个只读过三国演义没玩过王者荣耀的人说「貂蝉被蓝打死了」,你确定ta不会反问你:「啥?貂蝉被谁打死了?lan是谁?」*
在单卡GTX 1080Ti上,模型每迭代一个epoch大约需要20分钟。(实验室的CUDA版本较低,不排除更新CUDA版本后会快一些的可能。)
<img src="images/train.svg">
上图为验证集的CER随epoch的训练曲线。可以看到,目前验证集CER已经下降到11%。
图中没有显示测试集的表现。测试集的CER稍高一些,在14%。
通过外接语言模型可以将测试集的CER降低到8%。
项目目前提供的预训练模型训练了大约是100个epoch时候的,已经接近最好了。
没有合适的资源?快使用搜索试试~ 我知道了~
基于端到端的深度神经网络的中文普通话语音识别项目源码
共27个文件
py:17个
md:6个
txt:1个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 11 浏览量
2023-11-20
11:11:40
上传
评论
收藏 65KB ZIP 举报
温馨提示
基于端到端的深度神经网络的中文普通话语音识别项目源码 使用的是门控卷积神经网络(Gated Convolutional Network),网络结构类似于Facebook在2016年提出的Wav2letter。但是使用的激活函数不是ReLU或者是HardTanh,而是GLU(门控线性单元)。因此称作门控卷积网络。根据我的实验,使用GLU的收敛速度比HardTanh要快。如果你想要研究卷积网络用于语音识别的效果,这个项目可以作为一个参考。
资源推荐
资源详情
资源评论
收起资源包目录
masr-master.zip (27个子文件)
masr-master
beamdecode.py 1KB
feature.py 870B
examples
embedding.py 1KB
_init_path.py 244B
demo-server.py 390B
demo-recognize.py 185B
demo-record-recognize.py 279B
demo-client.py 324B
record.py 820B
train.py 170B
docs
compare.md 4KB
lm.md 4KB
train.md 2KB
embedding.md 2KB
demo.md 377B
decoder.py 5KB
data.py 3KB
requirements.txt 26B
models
__init__.py 0B
trainable.py 4KB
base.py 1KB
conv.py 2KB
.gitignore 100B
images
train.svg 33KB
embedding.png 37KB
train.py 4KB
README.md 2KB
共 27 条
- 1
资源评论
云哲-吉吉2021
- 粉丝: 4053
- 资源: 1128
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功