下载 >  开发技术 >  其它 > 语音识别技术
1

语音识别技术

盛矽电子是专业从事方案与技术服务的提供商。专注于语音识别、智能玩具、儿童电脑、语音芯片等领域。盛矽电子由年轻有为、高学历、有多年工作经验的员工组成,踏实敬业,技术实力雄厚。成功的服务于消费类电子、玩具、礼品、仪器等行业,为客户提供高附加值的产品方案与技术支持。 您的产品如果选择了盛矽电子的语音识别(注1)产品线,就立即升级为能听懂人命令智能产品,能与人进行交互式对话,提升了产品附价值,为客户创造更多利润。盛矽电子的高品质语音级、音乐级的放音·录音(自有算法)产品线,硬件资源丰富,质优价廉,可以应用于各种需要语音产品中。 盛矽电子推出提升开发效率的软件虚拟机(注2)的录音放音芯片。芯片集成了专业的语音算法和简单实用的接口平台;Flash存储技术,简单、高效、灵活、便捷、低风险。 盛矽电子在儿童电脑,智能算法方向有着独到的技术优势,俱有先进自主产权算法,已经成功向多家知名厂商提供方案级、机芯级的产品。 盛矽电子甘做您的研发部门,完整的技术研发体系能为客户量身定制个性化产品,为客户创造更大价值。 更多信息请访问:www.semxi.com 或电话、E-mail咨询。盛矽电子科技遵循客户为本的服务理念,务实、高效的工作作风,竭诚为您服务! 注1:语 音识别,也叫语音辨识,是机器能听懂人语言的技术,被视为本世纪最有挑战性、最具市场前景的应用技术之一。在玩具领域,该技术最具有交互娱乐性。 注2:软件虚拟机,技术类似于Java虚拟机,采用软件封装了技术;避免了专业的汇编指令难学的C指令及语音算法、电机控制等知识。 ...展开详情收缩
2011-11-18 上传大小:64KB
分享
收藏 (1) 举报

评论 共1条

oblivioner 给一星都嫌多,应该给0星,根本就是某电子狗玩具的说明书,没有半点实质性的技术内容
2014-05-23
回复
语音识别技术的前世今生

非常好的语音识别入门资料,梳理语音识别的技术路线,产生一个简单的认识。

立即下载
语音识别项目案例

用讯飞实现语音识别看半天也搞不懂,换成OLAMI平台,一个小demo,识别并输出语音语义。内附详情文档,项目可能不懂的地方,都在里面有解说。

立即下载
语音识别领域所有有价值的论文合集

语音识别关键论文合集,Automatic Speech Recognition has been investigated for several decades, and speech recognition models are from HMM-GMM to deep neural networks today. It's very necessary to see the history of speech recognition by this awesome paper roadmap. I will cover papers from traditional models to nowadays popular models, not only acoustic models or ASR systems, but also many interesting language models.

立即下载
语音识别技术的概况语音识别

语音识别与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。   语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。   语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

立即下载
《解析深度学习:语音识别实践》书籍 pdf版本

该资源主要是《解析深度学习,语音识别实践》这本书籍的完整版,需要的可以自行下载

立即下载
语音识别技术及其研究进展.pdf

语音识别技术及其研究进展.pdf语音识别技术及其研究进展.pdf

立即下载
在多媒体教学中应用语音识别技术

在多媒体教学中应用语音识别技术.在多媒体教学中应用语音识别技术.

立即下载
机器狗情感语音识别技术的研究

机器狗情感语音识别技术的研究.机器狗情感语音识别技术的研究.

立即下载
实用语音识别基础

语音识别基础教程,介绍语音识别的概念及技术

立即下载
应用模式识别技术导论 人脸识别与语音识别

《应用模式识别技术导论 人脸识别与语音识别《应用模式识别技术导论 人脸识别与语音识别《应用模式识别技术导论 人脸识别与语音识别

立即下载
国科大模式识别课件

此为中国科学院大学模式识别课件,课件作者中科院自动化所模式识别国家重点实验室刘成林老师。

立即下载
LD3320 ASR 非特定语音识别模块资料

LD3320 ASR 非特定语音识别模块资料,有兴趣可以看看

立即下载
嵌入式语音识别引擎介绍

嵌入式语音识别引擎介绍,先进的语音识别技术!

立即下载
windos 语音识别技术

window语音识别技术,如何实现window下的语音识别。

立即下载
CSHARP语音识别

本软件是关于CSHARP的语音识别的,实用与初学者使用!

立即下载
使用C++实现语音识别

这个是语音识别的,最近做语音合成和识别,所以上传的基本都是这种资源

立即下载
阿里云的语音识别(一句话识别) SDK PHP代码实现

在阿里云上的语音识别竟然没有PHP的SDK,而通过他们官方的所谓PHP的openSDK根本也没办法使用,于是,我基于他们的JAVA SDK改写成了PHP SDK,绝对可用!! 里面有些类是挪用了阿里云的官方php OpenSDK中core的代码 记得修改代码把里面的AccessKeyId和AccessKeySecret修改成自己所申请的哦!!

立即下载
解析深度学习——语音识别实践 pdf

译者序 iv 序 vii 前言 ix 术语缩写 xxii 符号 xxvii 第 1 章 简介 1 1.1 自动语音识别:更好的沟通之桥 . . . . . . . . . . . . . . . . . . . . . . . 1 1.1.1 人类之间的交流 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.1.2 人机交流 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 语音识别系统的基本结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3 全书结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.3.1 第一部分:传统声学模型 . . . . . . . . . . . . . . . . . . . . . . 6 1.3.2 第二部分:深度神经网络 . . . . . . . . . . . . . . . . . . . . . . 6 1.3.3 第三部分:语音识别中的 DNN-HMM 混合系统 . . . . . . . . . . 7 1.3.4 第四部分:深度神经网络中的表征学习 . . . . . . . . . . . . . . 7 1.3.5 第五部分:高级的深度模型 . . . . . . . . . . . . . . . . . . . . . 7 第一部分 传统声学模型 9 第 2 章 混合高斯模型 11 2.1 随机变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.2 高斯分布和混合高斯随机变量 . . . . . . . . . . . . . . . . . . . . . . . . 12 2.3 参数估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.4 采用混合高斯分布对语音特征建模 . . . . . . . . . . . . . . . . . . . . . 16 第 3 章 隐马尔可夫模型及其变体 19 3.1 介绍 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.2 马尔可夫链 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.3 序列与模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.3.1 隐马尔可夫模型的性质 . . . . . . . . . . . . . . . . . . . . . . . . 23 3.3.2 隐马尔可夫模型的仿真 . . . . . . . . . . . . . . . . . . . . . . . . 24 3.3.3 隐马尔可夫模型似然度的计算 . . . . . . . . . . . . . . . . . . . . 24 3.3.4 计算似然度的高效算法 . . . . . . . . . . . . . . . . . . . . . . . . 26 3.3.5 前向与后向递归式的证明 . . . . . . . . . . . . . . . . . . . . . . 27 3.4 期望最大化算法及其在学习 HMM 参数中的应用 . . . . . . . . . . . . . 28 3.4.1 期望最大化算法介绍 . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.4.2 使用 EM 算法来学习 HMM 参数——Baum-Welch 算法 . . . . . . 30 3.5 用于解码 HMM 状态序列的维特比算法 . . . . . . . . . . . . . . . . . . . 34 3.5.1 动态规划和维特比算法 . . . . . . . . . . . . . . . . . . . . . . . . 34 3.5.2 用于解码 HMM 状态的动态规划算法 . . . . . . . . . . . . . . . . 35 3.6 隐马尔可夫模型和生成语音识别模型的变体 . . . . . . . . . . . . . . . . 37 3.6.1 用于语音识别的 GMM-HMM 模型 . . . . . . . . . . . . . . . . . 38 3.6.2 基于轨迹和隐藏动态模型的语音建模和识别 . . . . . . . . . . . . 39 3.6.3 使用生成模型 HMM 及其变体解决语音识别问题 . . . . . . . . . 40 第二部分 深度神经网络 43 第 4 章 深度神经网络 45 4.1 深度神经网络框架 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.2 使用误差反向传播来进行参数训练 . . . . . . . . . . . . . . . . . . . . . 48 4.2.1 训练准则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 4.2.2 训练算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.3 实际应用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.3.1 数据预处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 4.3.2 模型初始化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.3.3 权重衰减 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.3.4 丢弃法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.3.5 批量块大小的选择 . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.3.6 取样随机化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.3.7 惯性系数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.3.8 学习率和停止准则 . . . . . . . . . . . . . . . . . . . . . . . . . . 61 4.3.9 网络结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 4.3.10 可复现性与可重启性 . . . . . . . . . . . . . . . . . . . . . . . . . 62 第 5 章 高级模型初始化技术 65 5.1 受限玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 5.1.1 受限玻尔兹曼机的属性 . . . . . . . . . . . . . . . . . . . . . . . . 67 5.1.2 受限玻尔兹曼机参数学习 . . . . . . . . . . . . . . . . . . . . . . 70 5.2 深度置信网络预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.3 降噪自动编码器预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 5.4 鉴别性预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 5.5 混合预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 5.6 采用丢弃法的预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 第三部分 语音识别中的深度神经网络–隐马尔可夫混合模型 81 第 6 章 深度神经网络–隐马尔可夫模型混合系统 83 6.1 DNN-HMM 混合系统 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 6.1.1 结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 6.1.2 用 CD-DNN-HMM 解码 . . . . . . . . . . . . . . . . . . . . . . . . 85 6.1.3 CD-DNN-HMM 训练过程 . . . . . . . . . . . . . . . . . . . . . . . 86 6.1.4 上下文窗口的影响 . . . . . . . . . . . . . . . . . . . . . . . . . . 88 6.2 CD-DNN-HMM 的关键模块及分析 . . . . . . . . . . . . . . . . . . . . . 90 6.2.1 进行比较和分析的数据集和实验 . . . . . . . . . . . . . . . . . . 90 6.2.2 对单音素或者三音素的状态进行建模 . . . . . . . . . . . . . . . . 92 6.2.3 越深越好 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 6.2.4 利用相邻的语音帧 . . . . . . . . . . . . . . . . . . . . . . . . . . 94 6.2.5 预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.2.6 训练数据的标注质量的影响 . . . . . . . . . . . . . . . . . . . . . 95 6.2.7 调整转移概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 6.3 基于 KL 距离的隐马尔可夫模型 . . . . . . . . . . . . . . . . . . . . . . . 96 第 7 章 训练和解码的加速 99 7.1 训练加速 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 7.1.1 使用多 GPU 流水线反向传播 . . . . . . . . . . . . . . . . . . . . 100 7.1.2 异步随机梯度下降 . . . . . . . . . . . . . . . . . . . . . . . . . . 103 7.1.3 增广拉格朗日算法及乘子方向交替算法 . . . . . . . . . . . . . . 106 7.1.4 减小模型规模 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 7.1.5 其他方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 7.2 加速解码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 7.2.1 并行计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 7.2.2 稀疏网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 7.2.3 低秩近似 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 7.2.4 用大尺寸 DNN 训练小尺寸 DNN . . . . . . . . . . . . . . . . . . 114 7.2.5 多帧 DNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 第 8 章 深度神经网络序列鉴别性训练 117 8.1 序列鉴别性训练准则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 8.1.1 最大相互信息 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 8.1.2 增强型 MMI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 8.1.3 最小音素错误/状态级最小贝叶斯风险 . . . . . . . . . . . . . . . 120 8.1.4 统一的公式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 8.2 具体实现中的考量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 8.2.1 词图产生 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 8.2.2 词图补偿 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 8.2.3 帧平滑 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 8.2.4 学习率调整 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 8.2.5 训练准则选择 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 8.2.6 其他考量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 8.3 噪声对比估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 8.3.1 将概率密度估计问题转换为二分类设计问题 . . . . . . . . . . . . 127 8.3.2 拓展到未归一化的模型 . . . . . . . . . . . . . . . . . . . . . . . . 129 8.3.3 在深度学习网络训练中应用噪声对比估计算法 . . . . . . . . . . 130 第四部分 深度神经网络中的特征表示学习 133 第 9 章 深度神经网络中的特征表示学习 135 9.1 特征和分类器的联合学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 9.2 特征层级 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 9.3 使用随意输入特征的灵活性 . . . . . . . . . . . . . . . . . . . . . . . . . 140 9.4 特征的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 9.4.1 对说话人变化的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . 141 9.4.2 对环境变化的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . 142 9.5 对环境的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 9.5.1 对噪声的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 9.5.2 对语速变化的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . 147 9.6 缺乏严重信号失真情况下的推广能力 . . . . . . . . . . . . . . . . . . . . 148 第 10 章 深度神经网络和混合高斯模型的融合 151 10.1 在 GMM-HMM 系统中使用由 DNN 衍生的特征 . . . . . . . . . . . . . . 151 10.1.1 使用 Tandem 和瓶颈特征的 GMM-HMM 模型 . . . . . . . . . . . 151 10.1.2 DNN-HMM 混合系统与采用深度特征的 GMM-HMM 系统的比较 154 10.2 识别结果融合技术 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 10.2.1 识别错误票选降低技术( ROVER) . . . . . . . . . . . . . . . . . 157 10.2.2 分段条件随机场( SCARF) . . . . . . . . . . . . . . . . . . . . . 159 10.2.3 最小贝叶斯风险词图融合 . . . . . . . . . . . . . . . . . . . . . . 160 10.3 帧级别的声学分数融合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 10.4 多流语音识别 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 第 11 章 深度神经网络的自适应技术 165 11.1 深度神经网络中的自适应问题 . . . . . . . . . . . . . . . . . . . . . . . . 165 11.2 线性变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 11.2.1 线性输入网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 11.2.2 线性输出网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 11.3 线性隐层网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 11.4 保守训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 11.4.1 L 2 正则项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 11.4.2 KL 距离正则项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 11.4.3 减少每个说话人的模型开销 . . . . . . . . . . . . . . . . . . . . . 173 11.5 子空间方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 11.5.1 通过主成分分析构建子空间 . . . . . . . . . . . . . . . . . . . . . 175 11.5.2 噪声感知、说话人感知及设备感知训练 . . . . . . . . . . . . . . 176 11.5.3 张量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 11.6 DNN 说话人自适应的效果 . . . . . . . . . . . . . . . . . . . . . . . . . . 181 11.6.1 基于 KL 距离的正则化方法 . . . . . . . . . . . . . . . . . . . . . 181 11.6.2 说话人感知训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 第五部分 先进的深度学习模型 185 第 12 章 深度神经网络中的表征共享和迁移 187 12.1 多任务和迁移学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 12.1.1 多任务学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 12.1.2 迁移学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 12.2 多语言和跨语言语音识别 . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 12.2.1 基于 Tandem 或瓶颈特征的跨语言语音识别 . . . . . . . . . . . . 190 12.2.2 共享隐层的多语言深度神经网络 . . . . . . . . . . . . . . . . . . 191 12.2.3 跨语言模型迁移 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 12.3 语音识别中深度神经网络的多目标学习 . . . . . . . . . . . . . . . . . . . 197 12.3.1 使用多任务学习的鲁棒语音识别 . . . . . . . . . . . . . . . . . . 197 12.3.2 使用多任务学习改善音素识别 . . . . . . . . . . . . . . . . . . . . 198 12.3.3 同时识别音素和字素( graphemes) . . . . . . . . . . . . . . . . . 199 12.4 使用视听信息的鲁棒语音识别 . . . . . . . . . . . . . . . . . . . . . . . . 199 第 13 章 循环神经网络及相关模型 201 13.1 介绍 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 13.2 基本循环神经网络中的状态-空间公式 . . . . . . . . . . . . . . . . . . . . 203 13.3 沿时反向传播学习算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 13.3.1 最小化目标函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 13.3.2 误差项的递归计算 . . . . . . . . . . . . . . . . . . . . . . . . . . 205 13.3.3 循环神经网络权重的更新 . . . . . . . . . . . . . . . . . . . . . . 206 13.4 一种用于学习循环神经网络的原始对偶技术 . . . . . . . . . . . . . . . . 208 13.4.1 循环神经网络学习的难点 . . . . . . . . . . . . . . . . . . . . . . 208 13.4.2 回声状态( Echo-State)性质及其充分条件 . . . . . . . . . . . . . 208 13.4.3 将循环神经网络的学习转化为带约束的优化问题 . . . . . . . . . 209 13.4.4 一种用于学习 RNN 的原始对偶方法 . . . . . . . . . . . . . . . . 210 13.5 结合长短时记忆单元( LSTM)的循环神经网络 . . . . . . . . . . . . . . 212 13.5.1 动机与应用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 13.5.2 长短时记忆单元的神经元架构 . . . . . . . . . . . . . . . . . . . . 213 13.5.3 LSTM-RNN 的训练 . . . . . . . . . . . . . . . . . . . . . . . . . . 214 13.6 循环神经网络的对比分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 13.6.1 信息流方向的对比:自上而下还是自下而上 . . . . . . . . . . . . 215 13.6.2 信息表征的对比:集中式还是分布式 . . . . . . . . . . . . . . . . 217 13.6.3 解释能力的对比:隐含层推断还是端到端学习 . . . . . . . . . . 218 13.6.4 参数化方式的对比:吝啬参数集合还是大规模参数矩阵 . . . . . 218 13.6.5 模型学习方法的对比:变分推理还是梯度下降 . . . . . . . . . . 219 13.6.6 识别正确率的比较 . . . . . . . . . . . . . . . . . . . . . . . . . . 220 13.7 讨论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 第 14 章 计算型网络 223 14.1 计算型网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 14.2 前向计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224 14.3 模型训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 14.4 典型的计算节点 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 14.4.1 无操作数的计算节点 . . . . . . . . . . . . . . . . . . . . . . . . . 232 14.4.2 含一个操作数的计算节点 . . . . . . . . . . . . . . . . . . . . . . 232 14.4.3 含两个操作数的计算节点 . . . . . . . . . . . . . . . . . . . . . . 237 14.4.4 用来计算统计量的计算节点类型 . . . . . . . . . . . . . . . . . . 244 14.5 卷积神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 14.6 循环连接 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 14.6.1 只在循环中一个接一个地处理样本 . . . . . . . . . . . . . . . . . 249 14.6.2 同时处理多个句子 . . . . . . . . . . . . . . . . . . . . . . . . . . 251 14.6.3 创建任意的循环神经网络 . . . . . . . . . . . . . . . . . . . . . . 252 第 15 章 总结及未来研究方向 255 15.1 路线图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255 15.1.1 语音识别中的深度神经网络启蒙 . . . . . . . . . . . . . . . . . . 255 15.1.2 深度神经网络训练和解码加速 . . . . . . . . . . . . . . . . . . . . 258 15.1.3 序列鉴别性训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258 15.1.4 特征处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 15.1.5 自适应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260 15.1.6 多任务和迁移学习 . . . . . . . . . . . . . . . . . . . . . . . . . . 261 15.1.7 卷积神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261 15.1.8 循环神经网络和长短时记忆神经网络 . . . . . . . . . . . . . . . . 261 15.1.9 其他深度模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 15.2 技术前沿和未来方向 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 15.2.1 技术前沿简析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 15.2.2 未来方向 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 参考文献 267

立即下载
百度语音识别api

语音识别技术

立即下载
语音识别算法matlab 源代码!完整!可运行!

语音识别算法matlab 源代码!完整!可运行!

立即下载
关闭
img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

语音识别技术

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
为了良好体验,不建议使用迅雷下载
VIP和C币套餐优惠
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
您还未下载过该资源
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

若举报审核通过,可返还被扣除的积分

  • 举报人:
  • 被举报人:
  • *类型:
    • *投诉人姓名:
    • *投诉人联系方式:
    • *版权证明:
  • *详细原因: