没有合适的资源?快使用搜索试试~ 我知道了~
freesound-classification:Freesound Audio Tagging 2019挑战赛第三名解决方案的...
共30个文件
py:26个
license:1个
txt:1个
需积分: 10 1 下载量 162 浏览量
2021-05-02
19:38:27
上传
评论
收藏 58KB ZIP 举报
温馨提示
Freesound Audio Tagging 2019挑战赛第三名 我的方法概述如下。 楷模 我使用了两种类型的模型,它们都是基于卷积的。 第一种使用2d卷积并在梅尔级谱图上工作,而第二种使用1d卷积在具有相对较小的窗口大小(如256)的原始STFT表示之上,因此每帧只有5毫秒左右。 两种类型的模型都相对较浅,由10-12个卷积层(或5-6个resnet块)以及少量过滤器组成。 我使用一种深度监管的形式,在每个块之后(通常从第一个或第二个块开始)应用全局最大池,然后将每个层的maxpool输出连接起来,形成最终的特征向量,然后将其传递到2层完全连接的分类器。 我还尝试使用RNN代替某些模型的最大池。 它使结果有些差,但是RNN似乎犯了不同的错误,因此它证明是最终合奏中的好成员。 频率编码 2d卷积是位置不变的,因此无论特征位于何处,卷积的输出都将相同。 频谱图不是图像,Y轴对应于信号
资源推荐
资源详情
资源评论
收起资源包目录
freesound-classification-master.zip (30个子文件)
freesound-classification-master
ops
folds.py 768B
utils.py 3KB
padding.py 2KB
__init__.py 0B
training.py 8KB
transforms.py 8KB
audio.py 2KB
evaluate_2d_cnn.py 4KB
train_2d_cnn.py 16KB
train_hierarchical_cnn.py 16KB
train_backbone_cnn.py 16KB
requirements.txt 2KB
train_apc.py 8KB
datasets
__init__.py 0B
sound_dataset.py 1KB
LICENSE 11KB
create_class_map.py 661B
linear_blend.py 3KB
README.md 10KB
relabel_noisy_data.py 5KB
networks
cpc.py 12KB
__init__.py 0B
apc.py 11KB
losses.py 1KB
classifiers.py 37KB
adversarial_test.py 9KB
predict_2d_cnn.py 3KB
.gitignore 97B
finetune_hierarchical_cnn.py 14KB
train_cpc.py 8KB
共 30 条
- 1
资源评论
胡説个球
- 粉丝: 0
- 资源: 4613
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功