没有合适的资源?快使用搜索试试~ 我知道了~
针对欠定盲分离问题,提出了一种新的源恢复方法.在时频域局部区域采用复高斯分布对源信号进行建模,将语音信号的稀疏性和局部平稳性结合在一起,提出了一种新的混合模型来描述观测信号在局部区域的概率分布.通过该模型,将每个时频点的源信号状态的判断问题转换成模型的参数估计和后验概率的计算问题,最后通过子混合矩阵的逆恢复出源信号.实验结果表明,该方法具有很快的收敛速度,并且比已有方法具有更好的分离性能.
资源推荐
资源详情
资源评论
第 40 卷 第 7 期 自 动 化 学 报 Vol. 40, No. 7
2014 年 7 月 ACTA AUTOMATICA SINICA July, 2014
基于新型混合模型的欠定盲分离方法
陈永强
1, 2
王宏霞
1
摘 要 针对欠定盲分离问题, 提出了一种新的源恢复方法. 在时频域局部区域采用复高斯分布对源信号进行建模, 将语音信
号的稀疏性和局部平稳性结合在一起, 提出了一种新的混合模型来描述观测信号在局部区域的概率分布. 通过该模型, 将每个
时频点的源信号状态的判断问题转换成模型的参数估计和后验概率的计算问题, 最后通过子混合矩阵的逆恢复出源信号. 实
验结果表明, 该方法具有很快的收敛速度, 并且比已有方法具有更好的分离性能.
关键词 欠定盲分离, 混合模型, 稀疏性, 局部复高斯分布, 最大后验概率
引用格式 陈永强, 王宏霞. 基于新型混合模型的欠定盲分离方法. 自动化学报, 2014, 40(7): 1412−1420
DOI 10.3724/SP.J.1004.2014.01412
A Method for Under-determined Blind Source Separation Based on
New Mixture Model
CHEN Yong-Qiang
1, 2
WANG Hong-Xia
1
Abstract To solve the problem of under-determined blind source separation, we propose a new source recovery method.
By utilizing the complex valued Gaussian model to characterize the local distribution of source signals in each micro-region
in the time-frequency domain and combining speech signals
0
sparsity with their local stability, a new mixture model is
derived to characterize the local distribution of observed signals. We convert the problem of judging the state of each
source signal at each time-frequency point into a problem of model
0
s parameters estimation and posterior probability
computation. Finally, the source signals are recovered by sub-mixing matrix
0
s inverse. Experiment results show that the
prop osed method converges very fast and has better separation performance compared with the existing methods.
Key words Under-determined blind source separation, mixture model, sparsity, local complex Gaussian distribution,
maximum a posteriori
Citation Chen Yong-Qiang, Wang Hong-Xia. A method for under-determined blind source separation based on new
mixture model. Acta Automatica Sinica, 2014, 40(7): 1412−1420
盲源分离被广泛应用到语音识别、通信、生物
医学信号处理等许多领域. 以往的研究多数针对适
定或过定盲分离
[1−2]
, 要求观测信号数目 M 不少于
源信号数目 N, 从而使盲分离的应用受到了限制.
因此, 解决欠定混合 (即 M 小于 N ) 下的盲分离问
题就成为了盲分离领域的研究热点. 目前, 解决欠
定盲分离的方法有很多, 大多数是利用信号的稀疏
收稿日期 2012-12-31 录用日期 2013-08-01
Manuscript received December 31, 2012; accepted August 1,
2013
国家自然科学基金 (61170226), 中央高校基本科研业务费专项资金
(SWJTU11CX047, SWJTU12ZT02), 四川省青年科技创新研究团
队项目 (2011JTD0007) 资助
Supported by National Natural Science Foundation of China
(61170226), Fundamental Research Funds for the Central Uni-
versities (SWJTU11CX047, SWJTU12ZT02), and Young Inno-
vative Research Team of Sichuan Province (2011JTD0007)
本文责任编委 张长水
Recommended by Associate Editor ZHANG Chang-Shui
1. 西南交通大学信息科学与技术学院 成都 610031 2. 成都信息工
程学院电子实验中心 成都 610225
1. School of Information Science and Technology, Southwest
Jiaotong University, Chengdu 610031 2. Electronic Exper-
iment Center, Chengdu University of Information Technology,
Chengdu 610225
性. 文献 [3] 提出的退化分离估计技术 (Degenerate
unmixing estimation technique, DUET) 假设源信
号在时频域具有正交性, 以此来分离源信号. 文献
[4] 进一步将 DUET 算法拓展到多个传感器的情况.
以上文献对信号的稀疏性要求很高, 当源信号的稀
疏度不够, 在某些时频点相互重叠时, 就会产生较大
的音乐噪声.
文献 [5] 将信号的稀疏性与指数型分布联系起
来, 在概率统计的框架下估计源信号. 为了获得更
好的分离性能, 文献 [6−11] 相继从概率模型的角
度, 提出了各种盲分离方法. 文献 [6] 提出拉普拉
斯混合模型 (Laplacian mixture model, LMM) 来
估计混合矩阵, 并通过 L
1
-norm 最小化方法恢复
源信号. 文献 [7−8] 分别采用柯西分布和方向拉普
拉斯混合模型 (Mixtures of directional Laplacian
distributions, MDLD) 获得二元时频掩蔽的最大
后验估计. 文 献 [9] 则采 用高 斯分布 来描述源信
号在局部区域的分布, 并同时估计混合矩阵和参
数, 但收敛速度非常慢. 文献 [10−11] 分别采用
7 期 陈永强等: 基于新型混合模型的欠定盲分离方法 1413
高斯混合模型 (Gaussian mixture model, GMM)
和可伸缩高斯混合模型 (Gaussian scaled mixture
model, GSMM) 描述源信号的分布, 其计算量会随
源信号个数按指数关系急剧增加, 计算负担相当大.
文献 [12] 提出的基于广义高斯分布 (Generalized
Gaussian distribution, GGD) 的盲分离算法, 每次
迭代都需对函数进行优化, 同样存在计算复杂度大
的问题.
相比基于概率模型的方法, 文献 [13−17] 的方
法则具有较小的计算量, 并且允许源信号在时频域
可以有一定的重叠, 从而减小音乐噪声. 文献 [13] 提
出的子空间投影方法, 在每个时频点的主导源个数
严格小于观测信号个数时, 可以判断该时频点有哪
些源处于激活状态, 以此来恢复源信号. 文献 [14] 则
提出了子空间投影的改进方法, 通过寻找使得观测
矢量到混合矩阵列矢量张成的子空间距离为 0 (或
接近 0) 时, 所需的最少列矢量数目来判断每个时频
点处的实际主导源数. 文献 [15] 进一步将条件放宽,
允许每个时频点上的主导源个数最多可以达到观测
信号的个数. 文献 [16] 则不限制主导源的个数, 只
要源数目和观测信号数目满足 N ≤ 2M − 1 条件,
就可以分离源信号. 但是, 文献 [15−16] 采用的是维
格纳-威利分布方法, 是二次型时频表示, 因此含有
不同源之间的交叉项, 当交叉项无法完全去除或者
交叉项和自项在某些时频点重合时, 会对源信号的
分离性能产生影响. 文献 [17] 则提出一种基于短时
傅立叶变换 (Short time Fourier transform, STFT)
的观测信号协方差矩阵对角化方法, 来判断时频域
上的局部区域有哪些源处于激活状态. 与文献 [15]
一样, 该方法同样允许每个时频点上主导源的个数
最多可以为观测信号个数. 由于 STFT 是线性变换,
不存在交叉项的问题, 因此, 对语音信号有比较好
的分离性能. 但该方法有一个假设前提, 即每个局部
区域内所有时频点上起主导作用的源是完全一样的.
由于语音信号是非平稳的, 当局部区域内不同时频
点上的主导源不一样时, 分离性能会下降. 针对以上
文献在判断时频点主导源时所存在的问题, 本文提
出了一种通过最大后验概率来判断各个时频点源信
号状态的新方法. 本文对信号采用 STFT 变换, 将
时频点上源信号的状态作为隐变量, 利用语音信号
的弱稀疏性和局部平稳性, 构建了一个新的混合模
型来描述局部区域内观测信号的分布; 然后, 通过对
混合模型的参数估计, 用最大后验概率来判断每个
时频点的源信号状态, 并由此恢复出源信号. 与文献
[17] 不同的是, 本文算法可以对每个时频点的源信
号状态进行独立的判断, 并不要求局部区域内各时
频点的主导源必须是完全一样的, 这与文献 [13−14]
类似. 但是, 本文算法允许主导源个数最多可以与观
测信号数目相等, 因此优于文献 [13−14] 的算法. 虽
然文献 [9] 也采用了局部高斯分布, 但是本文提出的
是一种局部区域的混合模型. 本文算法并不将源信
号本身作为隐变量, 而是将源信号的状态作为隐变
量, 并利用了信号的稀疏性. 本文提出的混合模型可
以有效克服 GMM、GSMM
[10−11]
和 GGD 模型
[12]
计算量过大的问题, 具有很快的收敛速度和更好的
分离性能.
1 问题描述
本文考虑欠定盲分离, 即观测信号的个数 M 小
于源信号的个数 N . 对观测信号采用短时傅里叶变
换, 在每个时频点, 瞬时混合模型可写成
x(t, f) = As(t, f) (1)
其中, x(t, f) = [x
1
(t, f), · · · , x
M
(t, f)]
T
是 M 维
观测数据向量; s(t, f) = [s
1
(t, f), · · · , s
N
(t, f)]
T
是
N 维源信号数据向量; A 是 M × N 维混合矩阵. 本
文假设 A 行满秩, 且各源信号之间相互独立. 目前,
欠定盲分离混合矩阵的估计方法有很多
[18−21]
, 为了
减小计算量和估计精度, 很多文献在估计混合矩阵
之前, 先检测那些只有一个主导源的时频点或时频
区域 (即单源点或单源区)
[12, 14, 18, 21]
, 然后通过各种
聚类算法估计出混合矩阵的各个列矢量.
与适定 (M = N) 和超定 (M > N ) 盲分离不
同, 欠定盲分离即使估计出了混合矩阵, 也无法直接
估计出源信号, 因为欠定盲分离的源估计其实是一
个病态问题. 因此, 欠定盲分离包括混合矩阵估计和
源恢复两个问题, 本文主要讨论源恢复问题, 下面介
绍本文的源恢复方法.
2 观测信号的新型混合模型
2.1 混合模型的导出
先假设在任何时频点处的主导源个数等于观测
信号个数, 根据这一假设, 本文给出一种新的混合模
型来描述观测信号的分布. 为了引出这一混合模型,
先给出 4 个定义:
定义 1. M 个主导源对应 A 的 M 个列矢
量, 这些列矢量按照其在 A 中的原排列次序构成的
M × M 维子矩阵称为主导源的顺序子矩阵, 记为
B
q
(q = 1, 2, · · · , C
M
N
).
显然, 一共有 Q = C
M
N
个顺序子矩阵, B
q
表示
第 q 个顺序子矩阵.
定义 2. 顺序子矩阵 B
q
的各个列矢量对应主
导源信号, 将这些主导源信号的序号从小到大构成
的集合称为 B
q
的顺序集合, 记为 C
q
.
例如, B
q
的各列分别对应源信号 s
1
、s
3
、s
4
,
剩余8页未读,继续阅读
资源评论
weixin_38633897
- 粉丝: 10
- 资源: 972
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功