论文研究-基于MFCC和运动强度聚类初始化的多说话人识别.pdf

多说话人识别,

聚类初始化,

运动强度特征,

运动强度初始化

需积分: 6 1 下载量 142 浏览量 2019-07-22 18:04:39 上传评论 1 收藏 1.16MB PDF 举报

温馨提示

试读

4页

针对常用基于音频特征的多说话人聚类初始化方法精度不高这一问题, 提出了一种基于视频信号的新方法。该方法通过运用每一时间帧视频信号的运动强度特征对聚类初始化阶段的初始话者类进行选择, 有效提升了说话人初始类纯度。最后将该方法应用到高斯混合模型GMM多说话人识别系统。实验结果表明, 在整个会议集上该方法相比其他方法有了很大改善, 较之线性初始化系统的错误识别率平均降低了19. 436%, 较之改进的线性初始化系统的错误识别率平均降低了16. 618%。

资源推荐

资源评论