没有合适的资源?快使用搜索试试~ 我知道了~
rnn-speech:在TensorFlow中使用具有深rnns的ctc损失的字符级语音识别器
共31个文件
py:14个
png:3个
sh:2个
需积分: 13 0 下载量 2 浏览量
2021-05-14
10:48:47
上传
评论
收藏 89.97MB ZIP 举报
温馨提示
语音 在TensorFlow中将ctc损失与深RNN结合使用的字符级语音识别器。 关于 这是一个正在进行的项目,致力于实施Kyuyeon Hwang和Wonyong Sung在详细的字符级ISR。 它使用一个经过ctc损失训练的深度RNN声学模型和一个针对字符级语言模型训练的深度RNN在角色级别工作。 声学模型可以读取梅尔频率倒谱系数或梅尔滤波器组,其中梅尔滤波器组具有增量和双增量特征向量(分别为40或120个暗淡输入)。 音频信号处理使用完成。 目前只有声学模型已经完成。 提供一个预先训练的示例,可以在任何文件上尝试(例如,您自己录制的声音)。 LibriSpeech的预训练模型的测试清洁评估结果为: CER:15,2% 相对湿度:42,4% 它缺少仍在开发中的字符级语言模型。 数据 当前支持的数据集是: 通过Vassil Panayotov 数据通过两个管道馈送,一个用于
资源推荐
资源详情
资源评论
收起资源包目录
rnn-speech-master.zip (31个子文件)
rnn-speech-master
.gitignore 781B
config.ini 5KB
README.md 6KB
trained_models
english
acoustic
README.md 3KB
acousticmodel.ckpt.meta 96.85MB
hyperparams.p 1022B
acousticmodel.ckpt.index 585B
acousticmodel.ckpt.data-00000-of-00001 134B
checkpoint 93B
loss.png 60KB
learning_rate.png 20KB
error_rate_test.png 25KB
LICENSE 1KB
.gitattributes 108B
models
test_SpeechRecognizer.py 413B
AcousticModel.py 45KB
test_AcousticModel.py 3KB
LanguageModel.py 37KB
__init__.py 0B
SpeechRecognizer.py 4KB
test_LanguageModel.py 5KB
test_hyperparameter.sh 949B
prepare_data.sh 689B
requirements.txt 40B
stt.py 20KB
util
audioprocessor.py 7KB
hyperparams.py 7KB
dataprocessor.py 13KB
__init__.py 0B
test_dataProcessor.py 14KB
setuptextcorpus.py 266B
共 31 条
- 1
资源评论
任念辰
- 粉丝: 49
- 资源: 4570
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- chromedriver-mac-arm64.zip
- 蓝zapro.apk
- chromedriver-linux64.zip
- UCAS研一深度学习实验-MNIST手写数字识别python源码+详细注释(高分项目)
- 基于Python和PyTorch框架完成的一个手写数字识别实验源码(带MINIST手写数字数据集)+详细注释(高分项目)
- 基于Matlab在MNIST数据集上利用CNN完成手写体数字识别任务,并实现单层CNN反向传播算法+源代码+文档说明(高分项目)
- NVIDIA驱动、CUDA和Pytorch及其依赖
- 基于SVM多特征融合的微表情识别python源码+项目说明+详细注释(高分课程设计)
- html动态爱心代码一(附源码)
- c40539bc-071a-486c-9d52-9d0c18d62dac 4.html
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功