没有合适的资源?快使用搜索试试~ 我知道了~
vad函数matlab代码-pyBK:基于二进位说话人建模的说话人差异化python系统
共24个文件
uem:5个
lbl:5个
wav:5个
需积分: 9 2 下载量 144 浏览量
2021-05-20
13:42:05
上传
评论
收藏 27.16MB ZIP 举报
温馨提示
vad函数matlab代码pyBK-基于二进制关键说话人建模的说话人差异化python系统 所提供的系统在给定的音频文件列表上执行说话者二值化(在同声说话者群中进行语音分割和聚类)。 它基于该技术。 由于对二进制密钥背景模型(KBM)进行了会期培训,因此该系统不需要任何外部培训数据,从而为说话者区分任务提供了易于运行和调整的选项。 描述 此实现基于的实现,也可用于。 除了与二进制密钥相关的代码外,还包括用于扬声器数字化系统管线的有用功能。 在我们参与了所描述的,中的,和中的解释之后,添加了额外的细节和功能。 安装 这段代码是使用conda在python 3.6中编写和测试的。 它依靠一些常见的程序包来完成任务: 用于音频处理和特征提取 用于语音活动检测 如果您使用的是conda: $ conda create -n pyBK python=3.6 $ source activate pyBK $ conda install numpy $ conda install -c conda-forge librosa $ pip install webrtcvad $ git clone h
资源推荐
资源详情
资源评论
收起资源包目录
pyBK-master.zip (24个子文件)
pyBK-master
config_DIHARD.ini 5KB
uem
3056696.uem 2B
3063115.uem 2B
3055877.uem 2B
3057402.uem 2B
3054300.uem 0B
sad
3055877.lbl 213B
3054300.lbl 1KB
3063115.lbl 1KB
3056696.lbl 815B
3057402.lbl 386B
LICENSE 1KB
config.ini 5KB
README.md 5KB
eval-tools
reference.rttm 9KB
md-eval-v21.pl 105KB
audio
3056696.wav 11.61MB
3054300.wav 3.12MB
3057402.wav 10.65MB
3063115.wav 8.64MB
3055877.wav 2.88MB
main.py 9KB
.gitattributes 49B
diarizationFunctions.py 37KB
共 24 条
- 1
资源评论
weixin_38571759
- 粉丝: 6
- 资源: 897
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- apk.tw_LineLite_v8a_v.2.17.1_sign.apk
- Elasticsearch实战:构建高效搜索系统的秘诀.zip
- HTML+CSS+JS网页设计:从入门到精通.zip
- 数据库课程设计:从理论到实践的全面指南.zip
- Python闭包:深入理解与应用场景解析.zip
- Win64OpenSSL-3-3-0.exe
- 课高分程设计-基于C++实现的民航飞行与地图简易管理系统-南京航空航天大学
- 航天器遥测数据故障检测系统python源码+文档说明+数据库(课程设计)
- 北京航空航天大学操作系统课设+ppt+实验报告
- 基于Vue+Echarts实现风力发电机中传感器的数据展示监控可视化系统+源代码+文档说明(高分课程设计)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功