【免费】阿里开源语音识别模型DFSMN1_开源端到端语音资源-CSDN文库

需积分: 0 85 浏览量 2022-08-04 12:25:46 上传评论收藏 986KB PDF 举报

资源详情

资源评论

资源推荐

阿里妹导读：近日，阿里巴巴达摩院机器智能实验室开源了新一代语音识别模型DFSMN，将

全球语音识别准确率纪录提高至96.04%（这一数据测试基于世界最大的免费语音识别数据库

LibriSpeech）。

对比目前业界使用最为广泛的LSTM模型，DFSMN模型训练速度更快、识别准确率更高。采

用全新DFSMN模型的智能音响或智能家居设备，相比前代技术深度学习训练速度提到了3

倍，语音识别速度提高了2倍。

开源地址：

https://github.com/tramphero/kaldi

本文作者：张仕良

阿里开源语音识别模型

DFSMN

在近期举行的云栖大会武汉峰会上，装有DFSMN语音识别模型的“AI收银员”在与真人店员

的PK中，在嘈杂环境下准确识别了用户的语音点单，在短短49秒内点了34杯咖啡。此外，装

备这一语音识别技术的自动售票机也已在上海地铁“上岗”。

著名语音识别专家，西北工业大学教授谢磊表示：“阿里此次开源的DFSMN模型，在语音识

别准确率上的稳定提升是突破性的，是近年来深度学习在语音识别领域最具代表性的成果之

一，对全球学术界和AI技术应用都有巨大影响。”

阿里开源语音识别模型DFSMN

剩余10页未读，继续阅读

评论0

内容反馈

王者丶君临天下

粉丝: 17
资源: 265

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip