rnn-speech:在TensorFlow中使用具有深rnns的ctc损失的字符级语音识别器

共31个文件

py：14个

png：3个

sh：2个

Python

需积分: 13 0 下载量 2 浏览量 2021-05-14 10:48:47 上传评论收藏 89.97MB ZIP 举报

温馨提示

语音在TensorFlow中将ctc损失与深RNN结合使用的字符级语音识别器。关于这是一个正在进行的项目，致力于实施Kyuyeon Hwang和Wonyong Sung在详细的字符级ISR。它使用一个经过ctc损失训练的深度RNN声学模型和一个针对字符级语言模型训练的深度RNN在角色级别工作。声学模型可以读取梅尔频率倒谱系数或梅尔滤波器组，其中梅尔滤波器组具有增量和双增量特征向量（分别为40或120个暗淡输入）。音频信号处理使用完成。目前只有声学模型已经完成。提供一个预先训练的示例，可以在任何文件上尝试（例如，您自己录制的声音）。 LibriSpeech的预训练模型的测试清洁评估结果为： CER：15,2％相对湿度：42,4％它缺少仍在开发中的字符级语言模型。数据当前支持的数据集是：通过Vassil Panayotov 数据通过两个管道馈送，一个用于

资源推荐

资源详情

资源评论