下载 >  开发技术 >  其它 > 语音识别方案
1

语音识别方案

盛矽电子是专业从事方案与技术服务的提供商。专注于语音识别、智能玩具、儿童电脑、语音芯片等领域。盛矽电子由年轻有为、高学历、有多年工作经验的员工组成,踏实敬业,技术实力雄厚。成功的服务于消费类电子、玩具、礼品、仪器等行业,为客户提供高附加值的产品方案与技术支持。 您的产品如果选择了盛矽电子的语音识别(注1)产品线,就立即升级为能听懂人命令智能产品,能与人进行交互式对话,提升了产品附价值,为客户创造更多利润。盛矽电子的高品质语音级、音乐级的放音·录音(自有算法)产品线,硬件资源丰富,质优价廉,可以应用于各种需要语音产品中。 盛矽电子推出提升开发效率的软件虚拟机(注2)的录音放音芯片。芯片集成了专业的语音算法和简单实用的接口平台;Flash存储技术,简单、高效、灵活、便捷、低风险。 盛矽电子在儿童电脑,智能算法方向有着独到的技术优势,俱有先进自主产权算法,已经成功向多家知名厂商提供方案级、机芯级的产品。 盛矽电子甘做您的研发部门,完整的技术研发体系能为客户量身定制个性化产品,为客户创造更大价值。 更多信息请访问:www.semxi.com 或电话、E-mail咨询。盛矽电子科技遵循客户为本的服务理念,务实、高效的工作作风,竭诚为您服务! 注1:语 音识别,也叫语音辨识,是机器能听懂人语言的技术,被视为本世纪最有挑战性、最具市场前景的应用技术之一。在玩具领域,该技术最具有交互娱乐性。 注2:软件虚拟机,技术类似于Java虚拟机,采用软件封装了技术;避免了专业的汇编指令难学的C指令及语音算法、电机控制等知识。 ...展开详情收缩
2011-11-18 上传大小:67KB
分享
收藏 举报

评论 共1条

erlnino 就一个语音识别的剧本,没有技术所需的。。。感觉是标题党
2012-03-09
回复
基于GEC210的语音识别控制

1、通过文件检索可以将固定的目录下的三种类型的图片和音乐给检索出来,然后再利用libjpeg库和libpng库来对jpeg图片和png图片进行解码,再通过直接操作framebuffer来将图片显示在LCD屏上,还可以使用触摸屏来切换图片。而播放音乐就要移植madplay库并使用当中的命令来播放音乐,也可以使用触摸屏来切换音乐。 2、拍照功能,利用V4L2来实现采集一帧的图像并把它显示在LCD屏上。 3、语言交互功能,首先在客户端实现录音功能,并将录制的音频数据通过socket传输到服务端中,服务端就先进行语法构建然后再进行语法识别,最后将识别的结果保存在xml文件中,再通过socket将xml文件传输到客户端中,客户端再对这个文件进行解析,并得到识别的id号,然后再根据id进行相应的操作,如操作上述两个功能。

立即下载
离线语音识别Demo

现在资源下载需要积分了,没有积分的联系微信号:yancyangwangli,我发送给你

立即下载
语音识别+机器人+超声波测距综合应用方案

语音识别+机器人+超声波测距综合应用方案 采用特定人识别技术,程序开始时用户需要对语音识别进行训练,每条指令训练两次,训练成功后,才开始真正的语音辨识,针对用户发出的不同语音指令,机器人执行不同的动作,在动作过程中进行超声波测距,遇到障碍物停止动作,并发射飞盘-Specific recognition technology for speech recognition the+ robot+ ultrasonic distance measurement applications, the beginning of the program the user needs to train the voice recognition training twice per instruction, training success, began the real speech recognition for user issues different voice commands, robots perform different actions, in ultrasonic ranging action process, an obstacle to stop the action and fired Frisbee

立即下载
家庭服务机器人语音识别方案

语音识别技术是家庭服务机器人涉及到的一项核心技术,非常重要

立即下载
语音识别语音识别语音识别语音识别

Wiley.Automatic.Speech.And.Speaker.Recognition.Mar.2009.eBook-ELOHiM

立即下载
speech语音识别开发

语音识别语音识别语音识别语音识别语音识别语音识别语音识别语音识别语音识别语音识别

立即下载
公交车报站 语音识别

语音识别语音识别语音识别语音识别语音识别语音识别语音识别语音识别语音识别语音识别语音识别语音识别

立即下载
车载语音识别技术分析

主要内容是语音识别技术在车载系统中的应用,并给出一套实验方案。

立即下载
语音识别相关语音识别相关

语音识别相关语音识别相关语音识别相关语音识别相关语音识别相关语音识别相关语音识别相关语音识别相关语音识别相关语音识别相关语音识别相关语音识别相关语音识别相关

立即下载
win7语音识别

语音识别设置。 解压后,运行regsvr.bat即可! peekabooty 制作,2013-05

立即下载
解析深度学习——语音识别实践 pdf

译者序 iv 序 vii 前言 ix 术语缩写 xxii 符号 xxvii 第 1 章 简介 1 1.1 自动语音识别:更好的沟通之桥 . . . . . . . . . . . . . . . . . . . . . . . 1 1.1.1 人类之间的交流 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.1.2 人机交流 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 语音识别系统的基本结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3 全书结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.3.1 第一部分:传统声学模型 . . . . . . . . . . . . . . . . . . . . . . 6 1.3.2 第二部分:深度神经网络 . . . . . . . . . . . . . . . . . . . . . . 6 1.3.3 第三部分:语音识别中的 DNN-HMM 混合系统 . . . . . . . . . . 7 1.3.4 第四部分:深度神经网络中的表征学习 . . . . . . . . . . . . . . 7 1.3.5 第五部分:高级的深度模型 . . . . . . . . . . . . . . . . . . . . . 7 第一部分 传统声学模型 9 第 2 章 混合高斯模型 11 2.1 随机变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.2 高斯分布和混合高斯随机变量 . . . . . . . . . . . . . . . . . . . . . . . . 12 2.3 参数估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.4 采用混合高斯分布对语音特征建模 . . . . . . . . . . . . . . . . . . . . . 16 第 3 章 隐马尔可夫模型及其变体 19 3.1 介绍 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.2 马尔可夫链 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.3 序列与模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.3.1 隐马尔可夫模型的性质 . . . . . . . . . . . . . . . . . . . . . . . . 23 3.3.2 隐马尔可夫模型的仿真 . . . . . . . . . . . . . . . . . . . . . . . . 24 3.3.3 隐马尔可夫模型似然度的计算 . . . . . . . . . . . . . . . . . . . . 24 3.3.4 计算似然度的高效算法 . . . . . . . . . . . . . . . . . . . . . . . . 26 3.3.5 前向与后向递归式的证明 . . . . . . . . . . . . . . . . . . . . . . 27 3.4 期望最大化算法及其在学习 HMM 参数中的应用 . . . . . . . . . . . . . 28 3.4.1 期望最大化算法介绍 . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.4.2 使用 EM 算法来学习 HMM 参数——Baum-Welch 算法 . . . . . . 30 3.5 用于解码 HMM 状态序列的维特比算法 . . . . . . . . . . . . . . . . . . . 34 3.5.1 动态规划和维特比算法 . . . . . . . . . . . . . . . . . . . . . . . . 34 3.5.2 用于解码 HMM 状态的动态规划算法 . . . . . . . . . . . . . . . . 35 3.6 隐马尔可夫模型和生成语音识别模型的变体 . . . . . . . . . . . . . . . . 37 3.6.1 用于语音识别的 GMM-HMM 模型 . . . . . . . . . . . . . . . . . 38 3.6.2 基于轨迹和隐藏动态模型的语音建模和识别 . . . . . . . . . . . . 39 3.6.3 使用生成模型 HMM 及其变体解决语音识别问题 . . . . . . . . . 40 第二部分 深度神经网络 43 第 4 章 深度神经网络 45 4.1 深度神经网络框架 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.2 使用误差反向传播来进行参数训练 . . . . . . . . . . . . . . . . . . . . . 48 4.2.1 训练准则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 4.2.2 训练算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.3 实际应用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.3.1 数据预处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 4.3.2 模型初始化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.3.3 权重衰减 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.3.4 丢弃法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.3.5 批量块大小的选择 . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.3.6 取样随机化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.3.7 惯性系数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.3.8 学习率和停止准则 . . . . . . . . . . . . . . . . . . . . . . . . . . 61 4.3.9 网络结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 4.3.10 可复现性与可重启性 . . . . . . . . . . . . . . . . . . . . . . . . . 62 第 5 章 高级模型初始化技术 65 5.1 受限玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 5.1.1 受限玻尔兹曼机的属性 . . . . . . . . . . . . . . . . . . . . . . . . 67 5.1.2 受限玻尔兹曼机参数学习 . . . . . . . . . . . . . . . . . . . . . . 70 5.2 深度置信网络预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.3 降噪自动编码器预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 5.4 鉴别性预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 5.5 混合预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 5.6 采用丢弃法的预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 第三部分 语音识别中的深度神经网络–隐马尔可夫混合模型 81 第 6 章 深度神经网络–隐马尔可夫模型混合系统 83 6.1 DNN-HMM 混合系统 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 6.1.1 结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 6.1.2 用 CD-DNN-HMM 解码 . . . . . . . . . . . . . . . . . . . . . . . . 85 6.1.3 CD-DNN-HMM 训练过程 . . . . . . . . . . . . . . . . . . . . . . . 86 6.1.4 上下文窗口的影响 . . . . . . . . . . . . . . . . . . . . . . . . . . 88 6.2 CD-DNN-HMM 的关键模块及分析 . . . . . . . . . . . . . . . . . . . . . 90 6.2.1 进行比较和分析的数据集和实验 . . . . . . . . . . . . . . . . . . 90 6.2.2 对单音素或者三音素的状态进行建模 . . . . . . . . . . . . . . . . 92 6.2.3 越深越好 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 6.2.4 利用相邻的语音帧 . . . . . . . . . . . . . . . . . . . . . . . . . . 94 6.2.5 预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.2.6 训练数据的标注质量的影响 . . . . . . . . . . . . . . . . . . . . . 95 6.2.7 调整转移概率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 6.3 基于 KL 距离的隐马尔可夫模型 . . . . . . . . . . . . . . . . . . . . . . . 96 第 7 章 训练和解码的加速 99 7.1 训练加速 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 7.1.1 使用多 GPU 流水线反向传播 . . . . . . . . . . . . . . . . . . . . 100 7.1.2 异步随机梯度下降 . . . . . . . . . . . . . . . . . . . . . . . . . . 103 7.1.3 增广拉格朗日算法及乘子方向交替算法 . . . . . . . . . . . . . . 106 7.1.4 减小模型规模 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 7.1.5 其他方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 7.2 加速解码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 7.2.1 并行计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 7.2.2 稀疏网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 7.2.3 低秩近似 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 7.2.4 用大尺寸 DNN 训练小尺寸 DNN . . . . . . . . . . . . . . . . . . 114 7.2.5 多帧 DNN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 第 8 章 深度神经网络序列鉴别性训练 117 8.1 序列鉴别性训练准则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 8.1.1 最大相互信息 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 8.1.2 增强型 MMI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 8.1.3 最小音素错误/状态级最小贝叶斯风险 . . . . . . . . . . . . . . . 120 8.1.4 统一的公式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 8.2 具体实现中的考量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 8.2.1 词图产生 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 8.2.2 词图补偿 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 8.2.3 帧平滑 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 8.2.4 学习率调整 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 8.2.5 训练准则选择 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 8.2.6 其他考量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 8.3 噪声对比估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 8.3.1 将概率密度估计问题转换为二分类设计问题 . . . . . . . . . . . . 127 8.3.2 拓展到未归一化的模型 . . . . . . . . . . . . . . . . . . . . . . . . 129 8.3.3 在深度学习网络训练中应用噪声对比估计算法 . . . . . . . . . . 130 第四部分 深度神经网络中的特征表示学习 133 第 9 章 深度神经网络中的特征表示学习 135 9.1 特征和分类器的联合学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 9.2 特征层级 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 9.3 使用随意输入特征的灵活性 . . . . . . . . . . . . . . . . . . . . . . . . . 140 9.4 特征的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 9.4.1 对说话人变化的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . 141 9.4.2 对环境变化的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . 142 9.5 对环境的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 9.5.1 对噪声的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 9.5.2 对语速变化的鲁棒性 . . . . . . . . . . . . . . . . . . . . . . . . . 147 9.6 缺乏严重信号失真情况下的推广能力 . . . . . . . . . . . . . . . . . . . . 148 第 10 章 深度神经网络和混合高斯模型的融合 151 10.1 在 GMM-HMM 系统中使用由 DNN 衍生的特征 . . . . . . . . . . . . . . 151 10.1.1 使用 Tandem 和瓶颈特征的 GMM-HMM 模型 . . . . . . . . . . . 151 10.1.2 DNN-HMM 混合系统与采用深度特征的 GMM-HMM 系统的比较 154 10.2 识别结果融合技术 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 10.2.1 识别错误票选降低技术( ROVER) . . . . . . . . . . . . . . . . . 157 10.2.2 分段条件随机场( SCARF) . . . . . . . . . . . . . . . . . . . . . 159 10.2.3 最小贝叶斯风险词图融合 . . . . . . . . . . . . . . . . . . . . . . 160 10.3 帧级别的声学分数融合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 10.4 多流语音识别 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 第 11 章 深度神经网络的自适应技术 165 11.1 深度神经网络中的自适应问题 . . . . . . . . . . . . . . . . . . . . . . . . 165 11.2 线性变换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 11.2.1 线性输入网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 11.2.2 线性输出网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 11.3 线性隐层网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 11.4 保守训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 11.4.1 L 2 正则项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 11.4.2 KL 距离正则项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 11.4.3 减少每个说话人的模型开销 . . . . . . . . . . . . . . . . . . . . . 173 11.5 子空间方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 11.5.1 通过主成分分析构建子空间 . . . . . . . . . . . . . . . . . . . . . 175 11.5.2 噪声感知、说话人感知及设备感知训练 . . . . . . . . . . . . . . 176 11.5.3 张量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 11.6 DNN 说话人自适应的效果 . . . . . . . . . . . . . . . . . . . . . . . . . . 181 11.6.1 基于 KL 距离的正则化方法 . . . . . . . . . . . . . . . . . . . . . 181 11.6.2 说话人感知训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 第五部分 先进的深度学习模型 185 第 12 章 深度神经网络中的表征共享和迁移 187 12.1 多任务和迁移学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 12.1.1 多任务学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 12.1.2 迁移学习 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 12.2 多语言和跨语言语音识别 . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 12.2.1 基于 Tandem 或瓶颈特征的跨语言语音识别 . . . . . . . . . . . . 190 12.2.2 共享隐层的多语言深度神经网络 . . . . . . . . . . . . . . . . . . 191 12.2.3 跨语言模型迁移 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 12.3 语音识别中深度神经网络的多目标学习 . . . . . . . . . . . . . . . . . . . 197 12.3.1 使用多任务学习的鲁棒语音识别 . . . . . . . . . . . . . . . . . . 197 12.3.2 使用多任务学习改善音素识别 . . . . . . . . . . . . . . . . . . . . 198 12.3.3 同时识别音素和字素( graphemes) . . . . . . . . . . . . . . . . . 199 12.4 使用视听信息的鲁棒语音识别 . . . . . . . . . . . . . . . . . . . . . . . . 199 第 13 章 循环神经网络及相关模型 201 13.1 介绍 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 13.2 基本循环神经网络中的状态-空间公式 . . . . . . . . . . . . . . . . . . . . 203 13.3 沿时反向传播学习算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204 13.3.1 最小化目标函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 13.3.2 误差项的递归计算 . . . . . . . . . . . . . . . . . . . . . . . . . . 205 13.3.3 循环神经网络权重的更新 . . . . . . . . . . . . . . . . . . . . . . 206 13.4 一种用于学习循环神经网络的原始对偶技术 . . . . . . . . . . . . . . . . 208 13.4.1 循环神经网络学习的难点 . . . . . . . . . . . . . . . . . . . . . . 208 13.4.2 回声状态( Echo-State)性质及其充分条件 . . . . . . . . . . . . . 208 13.4.3 将循环神经网络的学习转化为带约束的优化问题 . . . . . . . . . 209 13.4.4 一种用于学习 RNN 的原始对偶方法 . . . . . . . . . . . . . . . . 210 13.5 结合长短时记忆单元( LSTM)的循环神经网络 . . . . . . . . . . . . . . 212 13.5.1 动机与应用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 13.5.2 长短时记忆单元的神经元架构 . . . . . . . . . . . . . . . . . . . . 213 13.5.3 LSTM-RNN 的训练 . . . . . . . . . . . . . . . . . . . . . . . . . . 214 13.6 循环神经网络的对比分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 13.6.1 信息流方向的对比:自上而下还是自下而上 . . . . . . . . . . . . 215 13.6.2 信息表征的对比:集中式还是分布式 . . . . . . . . . . . . . . . . 217 13.6.3 解释能力的对比:隐含层推断还是端到端学习 . . . . . . . . . . 218 13.6.4 参数化方式的对比:吝啬参数集合还是大规模参数矩阵 . . . . . 218 13.6.5 模型学习方法的对比:变分推理还是梯度下降 . . . . . . . . . . 219 13.6.6 识别正确率的比较 . . . . . . . . . . . . . . . . . . . . . . . . . . 220 13.7 讨论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 第 14 章 计算型网络 223 14.1 计算型网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 14.2 前向计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224 14.3 模型训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 14.4 典型的计算节点 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 14.4.1 无操作数的计算节点 . . . . . . . . . . . . . . . . . . . . . . . . . 232 14.4.2 含一个操作数的计算节点 . . . . . . . . . . . . . . . . . . . . . . 232 14.4.3 含两个操作数的计算节点 . . . . . . . . . . . . . . . . . . . . . . 237 14.4.4 用来计算统计量的计算节点类型 . . . . . . . . . . . . . . . . . . 244 14.5 卷积神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 14.6 循环连接 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 14.6.1 只在循环中一个接一个地处理样本 . . . . . . . . . . . . . . . . . 249 14.6.2 同时处理多个句子 . . . . . . . . . . . . . . . . . . . . . . . . . . 251 14.6.3 创建任意的循环神经网络 . . . . . . . . . . . . . . . . . . . . . . 252 第 15 章 总结及未来研究方向 255 15.1 路线图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255 15.1.1 语音识别中的深度神经网络启蒙 . . . . . . . . . . . . . . . . . . 255 15.1.2 深度神经网络训练和解码加速 . . . . . . . . . . . . . . . . . . . . 258 15.1.3 序列鉴别性训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258 15.1.4 特征处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 15.1.5 自适应 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260 15.1.6 多任务和迁移学习 . . . . . . . . . . . . . . . . . . . . . . . . . . 261 15.1.7 卷积神经网络 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261 15.1.8 循环神经网络和长短时记忆神经网络 . . . . . . . . . . . . . . . . 261 15.1.9 其他深度模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 15.2 技术前沿和未来方向 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 15.2.1 技术前沿简析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 15.2.2 未来方向 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 参考文献 267

立即下载
c# 语音识别系统

c# 语音识别c# 语音识别c# 语音识别c# 语音识别c# 语音识别c# 语音识别c# 语音识别c# 语音识别

立即下载
语音识别-科大讯飞

语音识别项目!利用科大讯飞接口实现的!!!!!!!!!

立即下载
语音识别算法matlab 源代码!完整!可运行!

语音识别算法matlab 源代码!完整!可运行!

立即下载
基于 HMM算法的语音识别的matlab程序

基于改进型HMM的语音识别模型。有matlab的源代码、GUI界面

立即下载
语音识别demo

离线语音识别,在词库中的定义的关键字,识别率99%,没有定义的识别率差一点。

立即下载
解析深度学习-语音识别实践pdf

本书首次专门讲述了如何将深度学习方法,特别是深度神经网络(DNN)技术应用于语音识别(ASR)领域。在过去的几年中,深度神经网络技术在语音识别领域的应用取得了前所未有的成功。这使得本书成为在深度神经网络技术的发展历程中一个重要的里程碑。作者继其前一本书Deep Learning: Methods and Applications 之后,在语音识别技术和应用上进行了更深入钻研,得成此作。与上一本书不同,该作并没有对深度学习的各个应用领域都进行探讨,而是将重点放在了语音识别技术及其应用上,并就此进行了更深入、更专一的讨论。难能可贵的是,这本书提供了许多语音识别技术背景知识,以及深度神经网络的技术细节,比如严谨的数学描述和软件实现也都包含其中。这些对语音识别领域的专家和有一定基础的读者来说都将是极其珍贵的资料。   本书的独特之处还在于,它并没有局限于目前常应用于语音识别技术的深度神经网络上,还兼顾包含了深度学习中的生成模型,这种模型可以很自然地嵌入先验的领域知识和问题约束。作者在背景材料中充分证实了自20 世纪90 年代早期起,语音识别领域研究者提出的深度动态生成模型(dynamic generative models)的丰富性,同时又将其与最近快速发展的深度鉴别性模型在统一的框架下进行了比较。书中以循环神经网络和隐动态模型为例,对这两种截然不同的深度模型进行了全方位有见地的优劣比较。这为语音识别中的深度学习发展和其他信号及信息处理领域开启了一个新的激动人心的方向。该书还满怀历史情怀地对四代语音识别技术进行了分析。当然,以深度学习为主要内容的第四代技术是本书所详细阐述的,特别是DNN 和深度生成模型的无缝结,将使得知识扩展可以在一种最自然的方式下完成。   总的来说,该书可能成为语音识别领域工作者在第四代语音识别技术时代的重要参考书。全书不但巧妙地涵盖了一些基本概念,使你能够理解语音识别全貌,还对近两年兴盛起来的强大的深度学习方法进行了深入的细节介绍。读完本书,你将可以看清前沿的语音识别是如何构建在深度神经网络技术上的,可以满怀自信地去搭建识别能力达到甚至超越人类的语音识别系统。

立即下载
讯飞与百度的实时在线语音识别

讯飞语音实时在线识别,百度语音实时在线识别

立即下载
语音识别源码(java)

语音识别源码(java) ASR Speaker Recognition Enhanced Voice Conference ! Yancheng!Li,!Liang!Wei,!Zhaoyuan!Zhang

立即下载
《解析深度学习:语音识别实践》书籍 pdf版本

该资源主要是《解析深度学习,语音识别实践》这本书籍的完整版,需要的可以自行下载

立即下载
关闭
img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

语音识别方案

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
为了良好体验,不建议使用迅雷下载
VIP和C币套餐优惠
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
您还未下载过该资源
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

若举报审核通过,可返还被扣除的积分

  • 举报人:
  • 被举报人:
  • *类型:
    • *投诉人姓名:
    • *投诉人联系方式:
    • *版权证明:
  • *详细原因: