没有合适的资源?快使用搜索试试~ 我知道了~
SpeakerDiarization_RNN_CNN_LSTM:扬声器分类是在音频中分离扬声器的问题。 可以有任意数量的发言者,...
共23个文件
png:9个
py:8个
pdf:2个
需积分: 20 2 下载量 73 浏览量
2021-05-29
14:59:45
上传
评论
收藏 3.46MB ZIP 举报
温馨提示
引文 如果您发现我们的项目有帮助,请在下面引用我们的 arxiv 报告: @misc{sharma2020speaker, title={Speaker Diarization: Using Recurrent Neural Networks}, author={Vishal Sharma and Zekun Zhang and Zachary Neubert and Curtis Dyreson}, year={2020}, eprint={2006.05596}, archivePrefix={arXiv}, primaryClass={eess.AS} } 说话人分类 扬声器分类是在音频中分离扬声器的问题。 可以有任意数量的发言者,最终结果应说明发言者开始和结束的时间。 在这个项目中,我们用 2 个通道和 2 个扬声器(在单独的通道
资源详情
资源评论
资源推荐
收起资源包目录
SpeakerDiarization_RNN_CNN_LSTM-master.zip (23个子文件)
SpeakerDiarization_RNN_CNN_LSTM-master
documentation
speaker-diarization-recurrent.pdf 1.36MB
speaker-diarization-recurrent
CompareLabelNPrediction.png 57KB
main.tex 7KB
CNN_1.png 200KB
RNN_1.png 157KB
CNN.png 49KB
RNN.png 37KB
MLP_6.png 171KB
sample.bib 3KB
RNN_4.png 134KB
RNN_3.png 132KB
MLP_2.png 212KB
frog.jpg 89KB
NN_Convo_Sample.py 454B
Alg4_RNN_1channel_2classes.py 6KB
MLP_2channel_4classes.py 4KB
speaker-diarization-recurrent.pdf 1.36MB
README.md 5KB
Audio_data.py 1KB
MLP.py 3KB
Alg1_MLP_1channel_2classes.py 7KB
Labels.py 2KB
Alg6_CNN_spectrumgram.py 10KB
共 23 条
- 1
龙窑溪
- 粉丝: 31
- 资源: 4520
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 目标检测-零售食品LOGO检测数据集-5000张图-+对应VOC-COCO-YOLO三种格式标签+数据集划分脚本
- 目标检测-零售食品LOGO检测数据集-1000张图-+对应VOC-COCO-YOLO三种格式标签+数据集划分脚本
- Delphi 12 控件之LMD.VCL.Full.Version.zip
- 常用阀门定位器的调试步骤及说明
- 计算机科学选修课:人工智能导论 第二节 PPT
- 计算机科学选修课:人工智能导论 第一章 PPT
- 忘记navicat密码时,此工具可以帮您查看密码
- 电子商务-电子商务平台-水果销售-在线购物-果库小程序.zip
- 基于React的后台开发框架(javascript)
- 用户界面设计-滑动选项卡-交互组件-用户体验-滑动选项卡小程序.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0