# A Full-Convolutional Neural Networks-Based Chinese Speech Recognition System
基于全卷积神经网络的中文语音识别系统
[![GPL-3.0 Licensed](https://img.shields.io/badge/License-GPL3.0-blue.svg?style=flat)](https://opensource.org/licenses/GPL-3.0) [![TensorFlow Version](https://img.shields.io/badge/Tensorflow-1.4+-blue.svg)](https://www.tensorflow.org/) [![Keras Version](https://img.shields.io/badge/Keras-2.0+-blue.svg)](https://keras.io/) [![Python Version](https://img.shields.io/badge/Python-3.x-blue.svg)](https://www.python.org/)
## Introduction 简介
本项目使用TensorFlow基于全深度卷积神经网络实现。
通过git克隆仓库以后,需要将datalist目录下的文件全部拷贝到dataset目录下,也就是将其跟数据集放在一起。
```shell
$ cp -rf datalist/* dataset/
```
目前可用的模型有24、25和251
本项目开始训练请执行:
```shell
$ python3 train_mspeech.py
```
本项目开始测试请执行:
```shell
$ python3 test_mspeech.py iters_num (这里的iters_num为迭代的step数,可以在生成的step_dfcnn.txt文件里查看)
```
测试之前,请确保代码中填写的模型文件路径存在。
ASRT API服务器启动请执行:
```shell
$ python3 asrserver.py
```
## Model 模型
### Speech Model 语音模型
CNN + LSTM/GRU + CTC
### Language Model 语言模型
基于概率图的最大熵隐马尔可夫模型
## About Accuracy 关于准确率
当前,最好的模型在测试集上基本能达到80%的汉语拼音正确率
不过由于目前国际和国内的部分团队能做到97%,所以正确率仍有待于进一步提高
## Python Import
Python的依赖库
* python_speech_features
* TensorFlow
* Keras
* Numpy
* wave
* matplotlib
* math
* Scipy
* h5py
## Data Sets 数据集
* 清华大学THCHS30中文语音数据集
data_thchs30.tgz
<http://cn-mirror.openslr.org/resources/18/data_thchs30.tgz>
<http://www.openslr.org/resources/18/data_thchs30.tgz>
test-noise.tgz
<http://cn-mirror.openslr.org/resources/18/test-noise.tgz>
<http://www.openslr.org/resources/18/test-noise.tgz>
resource.tgz
<http://cn-mirror.openslr.org/resources/18/resource.tgz>
<http://www.openslr.org/resources/18/resource.tgz>
* Free ST Chinese Mandarin Corpus
ST-CMDS-20170001_1-OS.tar.gz
<http://cn-mirror.openslr.org/resources/38/ST-CMDS-20170001_1-OS.tar.gz>
<http://www.openslr.org/resources/38/ST-CMDS-20170001_1-OS.tar.gz>
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 基于Python全卷积神经网络的语音识别系统源码+数据集+详细文档(高分毕业设计).zip基于Python全卷积神经网络的语音识别系统源码+数据集+详细文档(高分毕业设计).zip 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如软件工程、计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用,也可作为毕设项目、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 3、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
资源推荐
资源详情
资源评论
收起资源包目录
基于Python全卷积神经网络的语音识别系统源码+数据集+详细文档(高分毕业设计).zip (99个子文件)
DFCNN-master-master
model_speech
m_DFCNN
speech_model_dfcnn_e_0_step_60000.model.base 5.82MB
speech_model_dfcnn_e_0_step_60000.model 5.8MB
general_function
__init__.py 166B
file_dict.py 12KB
muti_gpu.py 4KB
__pycache__
file_dict.cpython-36.pyc 14KB
gen_func.cpython-36.pyc 555B
file_wav.cpython-36.pyc 5KB
muti_gpu.cpython-36.pyc 4KB
__init__.cpython-36.pyc 311B
gen_func.py 514B
file_wav.py 8KB
read_data.py 11KB
asrserver.py 3KB
datalist
st-cmds
test.wav.txt 129KB
train.wav.txt 6.29MB
test.syllabel.txt 145KB
dev.syllabel.txt 44KB
dev.wav.txt 39KB
train.syllabel.txt 7.06MB
thchs30
dev.wav.lst 31KB
test.wav.lst 91KB
train.wav.lst 371KB
test.syllabel.txt 423KB
dev.syllabel.txt 151KB
train.syllabel.txt 1.65MB
aishell
dev.wav.lst 909KB
test.wav.lst 463KB
train.wav.lst 7.67MB
test.syllabel.txt 638KB
dev.syllabel.txt 1.22MB
train.syllabel.txt 10.3MB
dataset
st-cmds
test.wav.txt 129KB
train.wav.txt 6.29MB
test.syllabel.txt 145KB
dev.syllabel.txt 44KB
dev.wav.txt 39KB
train.syllabel.txt 7.06MB
thchs30
dev.wav.lst 31KB
test.wav.lst 91KB
train.wav.lst 371KB
test.syllabel.txt 423KB
dev.syllabel.txt 151KB
train.syllabel.txt 1.65MB
aishell
dev.wav.lst 909KB
test.wav.lst 463KB
train.wav.lst 7.67MB
test.syllabel.txt 638KB
dev.syllabel.txt 1.22MB
train.syllabel.txt 10.3MB
LanguageModel.py 7KB
step_dfcnn.txt 54B
kill_PID.py 254B
test_mspeech.py 2KB
read_data_aishell.py 22KB
dict_2.txt 32KB
testClient.py 435B
train_mspeech.py 2KB
SpeechModel_DFCNN.py 17KB
test.py 3KB
README.md 2KB
log
20180903.log 5.66MB
20180907.log 16KB
20180905_2.log 577KB
20180829.log 15KB
20180904.log 161KB
20180831.log 10KB
20180905.log 369KB
20180830.log 10KB
20180824.log 113KB
20180906.log 2.73MB
model_language
language_model1.txt 47KB
language_model2.txt 4.97MB
dic_pinyin.txt 1.94MB
gpu_condition.py 60B
gen_aishell_data
gen_dict.py 13KB
aishell_pre.py 5KB
datalist
st-cmds
test.wav.txt 129KB
train.wav.txt 6.29MB
train.syllable.txt 7.06MB
test.syllable.txt 145KB
dev.syllable.txt 44KB
dev.wav.txt 39KB
thchs30
train.syllable.txt 1.65MB
cv.syllable.txt 151KB
test.syllable.txt 423KB
test.wav.lst 91KB
train.wav.lst 371KB
cv.wav.lst 31KB
.st-cmds.swp 12KB
aishell
dev.wav.lst 909KB
train.syllable.txt 10.3MB
test.syllable.txt 638KB
test.wav.lst 463KB
dev.syllable.txt 1.22MB
train.wav.lst 7.67MB
read_data_aishell.py 22KB
dict.txt 32KB
171265889347208773632.zip 416B
共 99 条
- 1
资源评论
不走小道
- 粉丝: 3193
- 资源: 4201
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功