没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
利用分层采样方法,融合波达方向和时间延迟两种信息,实现了对说话人的定位与跟踪.分层采样方法考虑波达方向和时间延迟这两种不同观测信息对说话人位置估计精度的差异,将基于波达方向滤波得到的状态后验概率密度函数作为基于时间延迟滤波的重要性采样函数,增强了重要性概率密度函数与后验概率密度函数的相似程度,从而改善了重要性概率密度函数的质量,减小了采样粒子权值的方差,提高了对说话人位置的估计精度.仿真实验验证了该方法的有效性.
资源推荐
资源详情
资源评论
第
49
卷第
4
期
2009
年
7
月
大连理工大学学报
Journal of Dalian University of Technology
Vol.49,
No.4
July 2 0 0 9
电曲宵夜
曲程事
量工事
业理事
业管带
业、事
业程事
业工
Et
齿启事
业信事
由与事
业子带
世电事
却也明来
文章编号:
1000-8608(2009)04-0580-07
基于分层采样粒子滤波的说话人跟踪方法
侯代文1,
2
殷福亮势陈
主去
I
øτ2
(
1.大连理工大学电子与信息工程学院,辽宁大连
116024;
2.
海军试验基地,辽宁大连
116041
)
摘要:利用分层采样方法,融合波达方向和时间延迟两种信息,实现了对说话人的定位与跟
踪.分层采样方法考虑波达方向和时间延迟这两种不同观测信息对说话人位置估计精度的差
异,将基于波达方向滤波得到的状态后验概率密度函数作为基于时间延迟滤波的重要性采样
函数,增强了重要性概率密度函数与后验概率密度函数的相似程度,从而改善了重要性概率
密度函数的质量,减小了采样粒子权值的方差,提高了对说话人位置的估计精度.仿真实验验
证了该方法的有效性.
关键词:说话人跟踪;粒子滤波;波达方向估计;时间延迟估计;分层采样
中图分类号:
TN713
文献标志码
:A
。弓
l
气主云·
日
说话人语音定位与跟踪问题是语音信号处理
领域的重要课题之一,它可以广泛应用于电视电
话会议系统、视频监控系统中的摄像头自动导引、
远距离说话人语音识别、计算机人机接口以及机
器人导航等场合[l
J
说话人定位与跟踪是根据麦克风阵列接收到
的说话人语音信息以及说话人的运动规律,实时
估计说话人位置的技术.经常使用的定位方法主
要有波束形成方法和时延估计方法
[2
、
3J
波束形
成方法通过改变麦克风阵列的指向模式,将各麦
克风接收到的信号"导向"某一方向,然后在信号
空间内搜索能够使期望信号输出功率最大的方
向,就认为是说话人所在方向.时延估计方法首先
确定一组麦克风对之间的时间延迟,再通过求解
一组非线性双曲面方程,得到说话人位置.上述两
种方法在自由声场条件下,都能够实现对说话人
的准确定位.然而在实际应用中,由于房间混响、
噪声干扰等因素的影响,有可能产生虚声源,此时
采用上述方法,会导致对说话人位置的错误估计.
Sturim
等四提出利用状态空间方法解决这一问
题,该方法通过建立动态方程,在估计说话人当前
位置时,不仅利用当前观测信息,而且利用当前时
刻之前的全部信息,因此能够滤除观测序列中具
有明显误差的观测量,从而在一定程度上解决了
说话人跟踪中的虚声源问题.以此为基础,
Dvorkind
等问利用卡尔曼滤波器跟踪说话人位
置,解决了虚声源问题.然而,在非高斯观测噪声
条件下,使用卡尔曼滤波方法所得估计结果偏差
较大.考虑到粒子滤披方法具有较强的处理非线
性、非高斯问题的能力,飞
lermaak
等
m
和
Ward
等
[7J
采用粒子滤波器
[8
、
9J
进行说话人跟踪,改善了
说话人跟踪的效果.但这两种方法均选用先验分
布作为重要性概率密度函数,由于粒子采样效率
低,常常会出现粒子匮乏现象,导致状态估计精度
降低.
为了实现对说话人的准确定位与跟踪,本文
提出基于波达方向和时间延迟的说话人联合跟踪
粒子滤波方法,并利用仿真实验对本文方法的有
效性进行验证.
1
粒子滤波方法
考虑说话人跟踪问题,系统状态方程和观测
收稿日期:
2007-07-02;
修回日期:
2009-05-13.
基金项目·国家自然科学基金资助项目
(60772161
,
60372082);
高等学校博士学科点专项科研基金资助项目
(200801410015)
,
作者简介:侯代文
0972-)
,男,博士,巴
mail:
hodevin@gmaiL
∞
m;
殷福亮.
0962-)
,男,教授,博士生导师
.E-mail:flyin@dlut.ed
u.cn.
第
4
期
侯代文等:基于分层采样粒子滤波的说话人跟踪方法
581
方程可以描述为
Xk
=
/(Xk
一
l
,V
k-l)
(1)
Zk
=
h(Xk
,n
k
)
(2)
式中
:
Xk
(Xk
Yk v
x
•
飞'.
) T
,表示说话人状
态,它包含说话人的位置岛、
Yk
及速度
V
x
•
、飞.
;/
是状态转移函数;
{v
k-
I ,
k
εN}
是独立同分布的
过程噪声序列山为观测向量,它可以是时间延
迟,也可以是波达方向汕是观测函数;
{nk'
k
ε
N}
是独立同分布的观测噪声序列.本文的目标是
通过观测序列
ZI
,
k
{z
;o
i =
1
,…,剖,得到说话
人状态拟的最优估计,从而实现说话人跟踪.
贝叶斯状态估计方法通过求解后验概率密度
函数
ρ
(Xk
I
ZI
,
k)'
根据方程
E(Xk
Iω
=f
时间|川
Xk
ω
求得状态向量矶的最优估计.
粒子滤波方法,也称序贯
Monte
Carlo
方法,
它通过
Mont
巳
Carlo
模拟,实现状态的贝叶斯递
推估计时.其核心思想是:用一组随机采样点及其
对应的权值表示所需的后验概率密度函数,从而
计算状态估计值.当采样点个数趋于无穷大时,
Monte
Carlo
模拟的概率密度函数等价于后验概
率密度函数,相应的状态估计值接近于最优的贝
叶斯估计.
令
{x~
,
i
=
1
,…,
N
s
}
表示一支撑点集,对应
的权值为(叫
,
i
=
1,…,
N
s
}
,其中权值叫满足归
一化条件
2
叫=1.用
(xi}21
表示描述后验概
率密度函数
P(Xk
I
Z
],k)
的随机采样点集合,则
h
时刻的后验概率密度函数可以表示为
N
ρ
(Xk
I
ZI
,
k)
""'"
~叫
δ
(Xk
-
xD
(4)
i=l
其中(3(.)为单位冲激响应函数.
如果支撑点集
(X~
,i =
1
,…,
NJ
由重要性概
率密度函数
q(X)
抽样得到,其相应的权值由以下
公式计算:
z
一
ρ
(X~
I Z],k)
(5)
k -
q(x~
I Z ],k)
根据贝叶斯原理,可以得到粒子权值的递推估计
形式为
ρ
(Z
是
IxDρ
(X~
I
X~I)
W k-I
q(x~
I
-:X
~I
,Zk)
(6)
在粒子滤波方法中,重要性概率密度函数
q(X)
的选取具有重要意义.重要性概率密度函数
与后验概率密度函数的逼近程度,直接决定重要
性采样的效率,从而决定状态估计的精度.
Doucet
等川已经证明,最优的重要性概率密度函数为
q(Xk
I X
k-
l ,
ZI
,
k)
=
ρ
(Xk
I
X
k-
I ,
Zk).
但在实际应用
中,
ρ
(Xk
I X• l
,
Zk)
的获取与直接从后验概率密度
函数中抽取样本同样困难,因而只能寻求次优的
重要性概率密度函数.
当多个观测信息可以利用,而且各信息对状
态估计的贡献存在程度差异时,分层采样方法提
供了改善重要性概率密度函数的途径.分层果样
方法
[11]
利用重要性重采样Ci
mportance
resampling)
的思想,复制代表先验概率分布
Po(X)
的粒子并重新计算权值.当重要性概率密
度函数元
'/2
,…
'/M
存在,而且任意一个
/~I
近
似于
/m
但不如
/m
准确时,可以考虑使用分层采
样方法.通常情况下,分层采样方法相对于普通的
粒子掠波方法并没有优越性,但在多个观测量
ZI
,
丘,…
,
ZM
可以利用,而且不同的观测量对状态估
计所提供的信息量不同时,该方法可以将上一层
的最新观测信息融入下一层滤波过程的重要性概
率密度函数中,得到比状态转移概率密度函数更
接近后验概率密度函数的采样函数,因而能提高
粒子的采样效率.此时,按照各个观测量所估计状
态精度的不同排序,分层采样方法在状态空间高
效搜索,下一层的状态估计结果将优于上一层的
状态估计结果.能够融合
M
个观测量的分层采样
粒子撞波算法如下.
设
{X~I
,
W~I}
兰
1
为
k-1
时刻的粒子及相应
的权值集合,在时刻
h
(1)初始化
{沪,
ωω)
兰
1=(XLl
,
wLI}21
(2)
循环
For
m = l ,M
①生成粒子
Xm
.i
~
qm
(X
m
I X
m-
I.i ,z
k)
②权值更新
W
m
.
ι
∞
W~l.i
ρ
(z
'k
I
xm.i)Pm(xm.i
I X
m-
l.i)
qm
(x
m
•
i
I
x
m
-
I
川
,
z
k)
③重采样
生成
ai
~
{w
m
•
i
}
乞,替换
{xm'i
,
ω
m.i}
兰
1
←
{X"
叫
7
(3)
结束
(xhwi}21=(xy
, ι
,
ωY
,
ι}
:=1
2
基于粒子滤波的麦克风阵列说话
人跟踪方法
麦克风阵列由处于不同空间位置并按一定几
剩余6页未读,继续阅读
资源评论
weixin_38741996
- 粉丝: 45
- 资源: 932
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于javaweb+Mysql 实现的卖鞋网站课程设计
- 【java毕业设计】在线环保网站源码(完整前后端+说明文档+LW).zip
- 业务安全渗透测试案例汇总.zip
- 【java毕业设计】供暖企业信息化报修平台源码(完整前后端+说明文档+LW).zip
- 一款适用于渗透测试、红队、src挖掘的弱口令生成工具.zip
- 【java毕业设计】个人网站管理系统源码(完整前后端+说明文档+LW).zip
- C++实现的三国杀桌面游戏代码解析
- C#大型药品进销存管理系统源码数据库 Access源码类型 WinForm
- student_distribution_map.html
- 【java毕业设计】个人理财管理系统源码(完整前后端+说明文档+LW).zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功