基于Python深度学习的中文语音识别系统（高分毕设项目）_基于机器学习的语音识别系统完整代码资源-CSDN文库

共89个文件

txt：30个

py：30个

lst：22个

版权申诉

神经网络

python

深度学习

语音识别

4 浏览量 2024-06-26 14:05:41 上传评论收藏 31.98MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

my_ch_speech_recognition.zip （89个子文件）

my_ch_speech_recognition

acoustic_model

gru_ctc_am.py 11KB

cnn_with_full_data.py 9KB

data

primewords

dev.wav.lst 436KB

test.wav.lst 443KB

train.wav.lst 3.44MB

test.syllabel.txt 552KB

dev.syllabel.txt 547KB

train.syllabel.txt 4.29MB

st-cmds

dev.wav.lst 39KB

test.wav.lst 129KB

train.wav.lst 6.29MB

test.syllabel.txt 145KB

dev.syllabel.txt 44KB

train.syllabel.txt 7.06MB

thchs30

dev.wav.lst 31KB

test.wav.lst 91KB

train.wav.lst 371KB

test.syllabel.txt 420KB

dev.syllabel.txt 151KB

train.syllabel.txt 1.64MB

aishell

dev.wav.lst 909KB

test.wav.lst 463KB

train.wav.lst 7.67MB

test.syllabel.txt 638KB

dev.syllabel.txt 1.22MB

train.syllabel.txt 10.3MB

cnn_ctc_am.py 12KB

cnn_with_fbank.py 14KB

extra_utils

__init__.py 0B

feature_extract.py 2KB

commons.py 516B

FSMNCell.py 3KB

GetData.py 20KB

新建文本文档.txt 0B

.gitattributes 66B

some_expriment

lm_develop

eval.py 2KB

data_load.py 4KB

hyperparams.py 600B

build_corpus.py 3KB

modules.py 13KB

prepro.py 3KB

train.py 4KB

README.md 3KB

gen_data

gen_aishell_lable.py 2KB

gen_thchs_lable.py 3KB

linshi.py 13KB

keras_test.py 2KB

train.wav.lst 3.45MB

my_develop.py 14KB

data_process

read_data_prime.py 23KB

gen_dict.py 13KB

aishell_pre.py 5KB

datalist

primewords

dev.wav.lst 436KB

test.wav.lst 443KB

train.wav.lst 3.44MB

test.syllabel.txt 552KB

dev.syllabel.txt 547KB

train.syllabel.txt 4.29MB

read_prim_data.py 2KB

st-cmds

test.wav.txt 129KB

train.wav.txt 6.29MB

test.syllabel.txt 145KB

dev.syllabel.txt 44KB

dev.wav.txt 39KB

train.syllabel.txt 7.06MB

thchs30

dev.wav.lst 31KB

test.wav.lst 91KB

train.wav.lst 371KB

test.syllabel.txt 423KB

dev.syllabel.txt 151KB

train.syllabel.txt 1.65MB

.st-cmds.swp 12KB

aishell

dev.wav.lst 909KB

test.wav.lst 463KB

train.wav.lst 7.67MB

test.syllabel.txt 638KB

dev.syllabel.txt 1.22MB

train.syllabel.txt 10.3MB

read_data_aishell.py 22KB

dict.txt 32KB

read_prim_data.py 2KB

.gitignore 433B

README.md 4KB

language_model

CBHG_lm.py 16KB

model_layers.py 13KB

hyperparams.py 600B

data

vocab.pkl 158KB

lable.txt 11.84MB

zh.tsv 23.69MB

# 基于深度学习的中文语音识别系统 [![GPL-3.0 Licensed](https://img.shields.io/badge/License-GPL3.0-blue.svg?style=flat)](https://opensource.org/licenses/GPL-3.0) [![TensorFlow Version](https://img.shields.io/badge/Tensorflow-1.4+-blue.svg)](https://www.tensorflow.org/) [![Keras Version](https://img.shields.io/badge/Keras-2.0+-blue.svg)](https://keras.io/) [![Python Version](https://img.shields.io/badge/Python-3.x-blue.svg)](https://www.python.org/) ### 基于python的中文语音识别系统. 包含声学模型和语言模型两个部分组成，两个模型都是基于神经网络。 - 声学模型 - `acoustic_model`文件夹下，**建议直接运行**`cnn_with_full.py` - 该项目实现了GRU-CTC中文语音识别声音模型，所有代码都在`gru_ctc_am.py`中，包括： - 增加了基于科大讯飞DFCNN的CNN-CTC结构的中文语音识别模型`cnn_ctc_am.py`，与GRU相比，对网络结构进行了稍加改造。 - 完全使用DFCNN框架搭建声学模型，稍加改动，将部分卷积层改为inception，使用时频图作为输入，`cnn_with_fbank.py`。 - 新增使用pluse版数据集的模型，`cnn_with_full.py`，建议直接训练这个模型。 - 语言模型 - `language_model`文件夹下 - 新增基于CBHG结构的语言模型`language_model\CBHG_lm.py`，该模型之前用于谷歌声音合成，移植到该项目中作为基于神经网络的语言模型。参考了一个大佬的输入法的项目:[https://github.com/crownpku/Somiao-Pinyin](https://github.com/crownpku/Somiao-Pinyin) - 数据集 - 增加stc、primewords、Aishell、thchs30四个数据集，整理为相同格式，放于`acoustic_model\data`中,调用四个数据集的脚本在`acoustic_model\extra_utils`中，将四个数据集下载后放到data目录下直接运行`acoustic_model\cnn_with_full.py`就可以使用所有数据进行训练了。 - 共计约430小时,相关链接：[http://www.openslr.org/resources.php](http://www.openslr.org/resources.php) |Name | train | dev | test |- | :-: | -: | -: |aishell | 120098| 14326 | 7176 |primewords | 40783 | 5046 | 5073 |thchs-30 | 10000 | 893 | 2495 |st-cmd | 10000 | 600 | 2000 - 实验结果 - 其中声学模型得到带有声调的拼音，如: ```python 识别结果：jin1 zi1 ``` - 语言模型由拼音是别为汉字，如： ```python 请输入测试拼音：ta1 mei2 you3 duo1 shao3 hao2 yan2 zhuang4 yu3 dan4 ta1 que4 ba3 ai4 qin1 ren2 ai4 jia1 ting2 ai4 zu3 guo2 ai4 jun1 dui4 wan2 mei3 de tong3 yi1 le qi3 lai2 她没有多少豪言壮语但她却把爱亲人爱家庭爱祖国爱军队完美地统一了起来请输入测试拼音：chu2 cai2 zheng4 bo1 gei3 liang3 qian1 san1 bai3 wan4 yuan2 jiao4 yu4 zi1 jin1 wai4 hai2 bo1 chu1 zhuan1 kuan3 si4 qian1 wu3 bai3 qi1 shi2 wan4 yuan2 xin1 jian4 zhong1 xiao3 xue2 除财政拨给两千三百万元教太资金外还拨出专款四千五百七十万元新建中小学请输入测试拼音：ke3 shi4 chang2 chang2 you3 ren2 gao4 su4 yao2 xian1 sheng1 shuo1 kan4 jian4 er4 xiao3 jie3 zai4 ka1 fei1 guan3 li3 he2 wang2 jun4 ye4 wo4 zhe shou3 yi1 zuo4 zuo4 shang4 ji3 ge4 zhong1 tou2 可是常常有人告诉姚先生说看见二小姐在咖啡馆里和王俊业握着族一坐坐上几个钟头 ``` [我的github: https://github.com/audier](https://github.com/audier) [我的github博客: audier.github.io](https://audier.github.io) [我的csdn博客: https://blog.csdn.net/chinatelecom08](https://blog.csdn.net/chinatelecom08)

评论收藏

内容反馈

版权申诉