没有合适的资源?快使用搜索试试~ 我知道了~
PerceptualAudio:音频的感知指标-感知相关的损失函数。 DPAM和CDPAM
共83个文件
py:19个
data-00000-of-00001:10个
meta:10个
需积分: 36 1 下载量 82 浏览量
2021-05-22
12:49:23
上传
评论
收藏 23MB ZIP 举报
温馨提示
深度感知音频指标(DPAM) 另外,请我们更新的改进指标: 从明显的差异中学到的可区分的感知音频指标 , , , , J.Mysore , Zeyu Jin 在2020年国际语音交流大会上被接受 这是我们的音频感知指标的Tensorflow实现(此处是pytorch实现)。 它包含(0)运行我们的感知度量(DPAM)的最少代码,(1)在我们的JND数据集上训练感知度量的代码,以及(2)使用我们的感知度量作为语音降噪损失函数的示例。 还要签出我们最新学习的指标:CDPAM:基于对比学习的深度感知音频相似性指标 请参阅cd cdpam并按照自述文件中的说明进行操作。 我们还提供以下方面的预训练模型: 我们利用CDPAM训练波形合成模型。 我们从这里开始使用代码库。 我们训练单扬声器和跨扬声器模型。 实时语音增强:我们利用CDPAM作为损失函数来训练SE模型。 我
资源推荐
资源详情
资源评论
收起资源包目录
PerceptualAudio-master.zip (83个子文件)
PerceptualAudio-master
metric_code
helper.py 12KB
dataloader.py 11KB
summaries
test 0B
saved_distances
m1 0B
helper.pyc 13KB
network_model.pyc 3KB
dataloader.pyc 9KB
main.py 11KB
network_model.py 4KB
README.md 4KB
metric_use_simple.py 6KB
metric_use.py 6KB
example_pip.py 186B
sample_audio
ref.wav 108KB
4.wav 108KB
2.wav 108KB
pre-model
scratch_loss
my_test_model.meta 877KB
my_test_model.index 6KB
my_test_model.data-00000-of-00001 2.78MB
linear_layer_loss
my_test_model.meta 498KB
my_test_model.index 4KB
my_test_model.data-00000-of-00001 961KB
pretrained_loss
loss_model.ckpt.data-00000-of-00001 4.63MB
loss_model.ckpt.index 7KB
loss_model.ckpt.meta 756KB
se_model
se_model.ckpt.meta 981KB
se_model.ckpt.data-00000-of-00001 629KB
se_model.ckpt.index 2KB
finetune_loss
my_test_model.meta 1.07MB
my_test_model.index 6KB
my_test_model.data-00000-of-00001 2.78MB
requirements.txt 90B
dataset
dataset_dummy_jnd.txt 7KB
dataset_combined.txt 749KB
dataset_reverb.txt 435KB
README.md 3KB
licence.txt 17KB
dataset_linear.txt 919KB
dataset_eq.txt 367KB
LICENSE 1KB
se_code
helper.py 12KB
data_import.pyc 6KB
summaries
test 0B
data_import.py 7KB
helper.pyc 12KB
network_model.pyc 3KB
network_model.py 5KB
dataset
dat
m1 0B
asc
trainset
m1 0B
valset
m1 0B
se_infer.py 2KB
se_train.py 8KB
README.md 2KB
dpam
helper.py 12KB
__init__.pyc 2KB
dpam.py 7KB
helper.pyc 13KB
network_model.pyc 4KB
pre-model
scratch_loss
my_test_model.meta 877KB
my_test_model.index 6KB
my_test_model.data-00000-of-00001 2.78MB
linear_layer_loss
my_test_model.meta 498KB
my_test_model.index 4KB
my_test_model.data-00000-of-00001 961KB
pretrained_loss
loss_model.ckpt.data-00000-of-00001 4.63MB
loss_model.ckpt.index 7KB
loss_model.ckpt.meta 756KB
se_model
se_model.ckpt.meta 981KB
se_model.ckpt.data-00000-of-00001 629KB
se_model.ckpt.index 2KB
finetune_loss
my_test_model.meta 1.07MB
my_test_model.index 6KB
my_test_model.data-00000-of-00001 2.78MB
__init__.py 2KB
network_model.py 4KB
setup.py 514B
README.md 12KB
cdpam
requirements.txt 147B
README.md 3KB
sample 0B
create_space
sample.py 6KB
main.py 353B
README.md 760B
共 83 条
- 1
资源评论
林文曦
- 粉丝: 26
- 资源: 4719
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于LSTM的SDN流量预测与负载均衡python源码+数据+详细注释(高分项目).zip
- 主机编号检测工具,可检测主机编号
- 基于LSTM的SDN流量预测与负载均衡python源码+数据+详细注释.zip
- WPF Prism框架-右键在位编辑 ListView
- 无线网络修复工具,适用win10,win11
- 无线网卡开关切换工具,更改无线网卡及蓝牙状态
- 医学图像分割数据:肝血管和肿瘤(HepaticVessel)切片分割【包含3个切面划分的数据集(3类别)、标签文件、可视化代码】
- vidstream-3-0.0.1.tar.gz
- 基于FPGA深度学习的SPI 驱动 HC595 点亮数码管
- 2023-2024学年教材费结算明细(公示) -V2.xls
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功