deepspeech.mxnet:百度DeepSpeech架构的MXNet实现

共31个文件

py：22个

cfg：2个

wav：2个

mxnet

arch

speech

speech-recognition

baidu

需积分: 9 0 下载量 166 浏览量 2021-05-18 07:12:14 上传评论收藏 215KB ZIP 举报

温馨提示

deepSpeech.mxnet：丰富语音示例此示例基于可帮助您使用以下方法大规模构建语音转文本（STT）模型 CNN，完全连接的网络，用于网络层的（Bi-）RNN，（Bi-）LSTM和（Bi-）GRU，批量归一化和辍学以提高培训效率，以及用于计算损失的经纱CTC。此外，为了创建自己的STT模型，您只需要编辑配置文件而不是实际代码即可。动机本示例旨在指导希望使用MXNet制作实用STT模型的人们。有了上面解释的丰富功能和便利，您可以比以前的示例更轻松地构建自己的语音识别模型。环境环境 MXNet版本：0.9.5+ GPU记忆体大小：2.4GB以上安装张量板进行记录 pip install tensorboard 用于音频预处理的（如果遇到关于libsndfile的错误，请遵循。） pip install soundfile 经纱CTC：请按照安装百度的经

资源推荐

资源详情

资源评论