没有合适的资源?快使用搜索试试~ 我知道了~
语音识别系统实验报告.doc
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 33 浏览量
2021-10-03
09:05:15
上传
评论
收藏 511KB DOC 举报
温馨提示
试读
17页
语音识别系统实验报告.doc
资源推荐
资源详情
资源评论
- -
语音识别系统实验报告
专业班级:信息平安
学号:
:
- word.zl-
- -
目录
一、 设计任务及要求………………………………………………
二、 语音识别的简单介绍
语者识别的概念……………………………………………
特征参数的提取……………………………………………
用矢量量化聚类法生成码本………………………………
的说话人识别…………………………………………
三、 算法程序分析
函数关系…………………………………………………
代码说明……………………………………………………
函数
函数
函数
函数
函数
函数
函数
四、 演示分析……………………………………………………!
五、 心得体会……………………………………………………
附:"#$ 程序代码………………………………………………
一、 设计任务及要求
实现语音识别功能。
- word.zl-
- -
二、 语音识别的简单介绍
基于 的说话人识别系统,矢量量化起着双重作用。在训练阶段,把每一
个说话者所提取的特征参数进展分类,产生不同码字所组成的码本。在识别%匹
配&阶段,我们用 方法计算平均失真测度%本系统在计算距离 时,采用欧
氏距离测度&,从而判断说话人是谁。
语音识别系统构造框图如图 所示。
图 语音识别系统构造框图
2.1 语者识别的概念
语者识别就是根据说话人的语音信号来判别说话人的身份。语音是人的自
然属性之一,由于说话人发音器官的生理差异以及后天形成的行为差异,每个
人的语音都带有强烈的个人色彩,这就使得通过分析语音信号来识别说话人成
为可能。用语音来鉴别说话人的身份有着许多独特的优点,如语音是人的固有
的特征,不会丧失或遗忘;语音信号的采集方便,系统设备本钱低;利用 网
络还可实现远程客户效劳等。因此,近几年来,说话人识别越来越多的受到人
们的重视。与其他生物识别技术如指纹识别、手形识别等相比较,说话人识别
不仅使用方便,而且属于非接触性,容易被用户承受,并且在已有的各种生物
特征识别技术中,是唯一可以用作远程验证的识别技术。因此,说话人识别的
应用前景非常广泛:今天,说话人识别技术已经关系到多学科的研究领域,不
同领域中的进步都对说话人识别的开展做出了奉献。说话人识别技术是集声学、
语言学、计算机、信息处理和人工智能等诸多领域的一项综合技术,应用需求
将十分广阔。在吃力语音信号的时候如何提取信号中关键的成分尤为重要。语
音信号的特征参数的好坏直接导致了区分的准确性。
2.2 特征参数的提取
对于特征参数的选取,我们使用 的方法来提取。'()) 参数是基于人
的听觉特性利用人听觉的屏蔽效应,在 ' 标度频率域提取出来的倒谱特征参
数。
'()) 参数的提取过程如下:
- word.zl-
- -
对输入的语音信号进展分帧、加窗,然后作离散傅立叶变换,获得频谱
分布信息。
设语音信号的 (* 为:
〔〕
其中式中 +%&为输入的语音信号,, 表示傅立叶变换的点数。
再求频谱幅度的平方,得到能量谱。
将能量谱通过一组'尺度的三角形滤波器组。
我们定义一个有 ' 个滤波器的滤波器组〔滤波器的个数和临界带的个数相近〕
采用的滤波器为三角滤波器,中心频率为 %&-.---///,'
本系统取 '.00。
计算每个滤波器组输出的对数能量。
N 1
2
a m
k 1
S(m) ln( | (k) | H (k)),
0 m M 1
X
〔〕
其中
m
H (k)
为三角滤波器的频率响应。
经过离散弦变换〔)*〕得到'())系数。
1
0
C(n) ( ) cos( ( 0.5 / )),(3)
0 1
M
m
S m n m m
n N
'()) 系数个数通常取 010,常常不用 0 阶倒谱系数,因为它反映的是频
谱能量,故在一般识别系统中,将称为能量系数,并不作为倒谱系数,本系统
选取 0 阶倒谱系数。
2.3 用矢量量化聚类法生成码本
我们将每个待识的说话人看作是一个信源,用一个码本来表征。码本是从
该说话人的训练序列中提取的 '()) 特征矢量聚类而生成。只要训练的序列足
够长,可认为这个码本有效地包含了说话人的个人特征,而与讲话的内容无关。
本系统采用基于分裂的 2" 的算法设计 码本,
( 1, 2, , )
k
X k K
为训练
序列, 为码本。
具体实现过程如下:
取提取出来的所有帧的特征矢量的型心%均值&作为第一个码字矢量。
将当前的码本根据以下规那么分裂,形成个码字。
〔〕
其中 从 变化到当前的码本的码字数,3 是分裂时的参数,本文 3.00。
根据得到的码本把所有的训练序列%特征矢量&进展分类,然后按照下面
两个公式计算训练矢量量化失真量的总和
[ ]n
D
以及相对失真%为迭代次数,初
- word.zl-
剩余16页未读,继续阅读
资源评论
gjmm89
- 粉丝: 14
- 资源: 19万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功