没有合适的资源?快使用搜索试试~ 我知道了~
denoiser:波形域中的实时语音增强(Interspeech 2020)我们提供了论文《波形域中的实时语音增强》的PyTor...
共51个文件
py:20个
wav:12个
yaml:4个
需积分: 50 5 下载量 115 浏览量
2021-03-19
06:16:38
上传
评论 4
收藏 1.71MB ZIP 举报
温馨提示
波形域中的实时语音增强(Interspeech 2020) 我们提供了本文的实现:。其中,我们提出了一种因果语音增强模型,该模型处理了在便携式计算机CPU上实时运行的原始波形。所提出的模型基于具有跳过连接的编码器-解码器体系结构。使用多个损失函数,可以在时域和频域上对其进行优化。经验证据表明,它能够消除各种背景噪音,包括固定和非固定噪音以及房间混响。此外,我们建议直接在原始波形上应用一组数据增强技术,以进一步提高模型性能及其泛化能力。 音频样本可以在这里找到: 所提出的模型基于最初为音乐源分离而提出的Demucs架构:( , )。 安装 首先,安装Python 3.7(Anaconda推荐)。 通过点子(您只想开箱即用地使用预先训练的模型) 赶紧跑 pip install denoiser 开发(如果您想培训或学习) 克隆此存储库并安装依赖项。我们建议使用全新的virtualenv或C
资源推荐
资源详情
资源评论
收起资源包目录
denoiser-master.zip (51个子文件)
denoiser-master
MANIFEST.in 130B
denoiser
audio.py 3KB
executor.py 3KB
utils.py 4KB
augment.py 8KB
live.py 6KB
evaluate.py 4KB
__init__.py 196B
solver.py 9KB
enhance.py 5KB
dsp.py 2KB
pretrained.py 2KB
stft_loss.py 5KB
demucs.py 16KB
resample.py 2KB
data.py 3KB
distrib.py 3KB
conf
config.yaml 3KB
dset
valentini.yaml 163B
debug.yaml 721B
dns.yaml 111B
img
demucs.png 115KB
pavucontrol.png 44KB
launch_valentini.sh 465B
.github
workflows
tests.yml 625B
train.py 3KB
LICENSE 19KB
dataset
debug
noisy
p287_003.wav 226KB
p287_005.wav 203KB
p287_004.wav 152KB
p287_001.wav 61KB
p287_006.wav 159KB
p287_002.wav 102KB
clean
p287_003.wav 226KB
p287_005.wav 203KB
p287_004.wav 152KB
p287_001.wav 61KB
p287_006.wav 159KB
p287_002.wav 102KB
launch_dns.sh 456B
CONTRIBUTING.md 829B
setup.cfg 88B
requirements.txt 175B
setup.py 2KB
requirements_cuda.txt 181B
.gitignore 134B
CODE_OF_CONDUCT.md 3KB
README.md 17KB
scripts
matlab_eval.py 14KB
hubconf.py 305B
make_debug.sh 438B
共 51 条
- 1
资源评论
锦宣
- 粉丝: 18
- 资源: 4564
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功