没有合适的资源?快使用搜索试试~ 我知道了~
Speaker-Recognition-System:EEC201最终项目
共21个文件
m:17个
png:3个
md:1个
需积分: 9 0 下载量 180 浏览量
2021-03-18
06:07:54
上传
评论
收藏 278KB ZIP 举报
温馨提示
说话人识别系统 EEC201最终项目 团队成员:钱伟泰,Ata Vafi 抽象的 该项目建立了一个依靠少量样本的说话人识别系统。它主要具有3个阶段的流水线:(1)特征提取(2)特征学习(3)说话人识别。在特征提取阶段,使用海明窗尺寸为256的短时傅立叶变换(STFT)。然后将20个滤波器用于MFCC以生成20维训练向量。在特征提取之后,使用矢量量化和k均值聚类来学习这些特征。在使用陷波滤波器生成更多噪声数据集之前,该系统在训练集上达到100%的精度,在测试集上达到100%的精度。 介绍 方法 首先,由于音频幅度不包含用户的任何唯一信息,因此将幅度标准化为[-1,1]范围。接下来,对信号的主要部分进行削波,并对削波后的信号执行短时离散傅立叶变换。在stft中,语音信号被阻塞为N个样本的重叠帧:第一个帧由前N个样本组成。第二帧在第一帧之后开始M个采样,并与N-M个采样重叠,以此类推。N和M为N
资源推荐
资源详情
资源评论
收起资源包目录
Speaker-Recognition-System-main.zip (21个子文件)
Speaker-Recognition-System-main
image
pipeline.PNG 48KB
MFCC.png 33KB
MFCC_40.png 195KB
src
main.m 1KB
compute_Distortion.m 649B
Mel_Spectrum.m 238B
Frame_Blocking.m 266B
training.m 693B
LBG.m 1KB
melfb.m 1KB
plot_2DClustering.m 2KB
disteu.m 771B
find_NearestCentroid.m 918B
hamming_window.m 157B
clustering_2Dtest.m 804B
testing.m 2KB
find_threshold.m 786B
update_Centroids.m 812B
expand_Codebook.m 577B
MFCC.m 721B
README.md 3KB
共 21 条
- 1
资源评论
YuanAndy
- 粉丝: 35
- 资源: 4491
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功