没有合适的资源?快使用搜索试试~ 我知道了~
DLJeju2018CodeRepoASR:关于使用GAN进行语音合成以提高ASR问题的语音识别准确性的工作的详细信息
共18个文件
xml:5个
md:4个
png:3个
需积分: 9 3 下载量 6 浏览量
2021-04-27
18:33:28
上传
评论
收藏 1.77MB ZIP 举报
温馨提示
使用半监督GAN的合成语音输出来提高语音识别精度 在这个项目中,我们使用深度学习通过WaveGAN和SpecGAN()来合成语音/音频。 这样合成的原始音频被用于改善基线系统。 入门 大多数深度学习技术都需要大量数据来训练系统。 但是大规模收集数据是一个瓶颈。 不仅必须拥有数据,而且还应该能够涵盖现实世界中发生的各种情况。 假设有一种方法可以从现有数据(标记的和未标记的)中生成新数据。 在本文中,我将探讨语音领域的可能性。 最近,语音识别方面的许多工作都集中在语音合成上。 自Goodfellow,Ian等人(2014)引入GAN以来,已经涌现出大量论文,后来成功地将其成功用于Images的样式转换中。 从那时起,图像的样式转换就开始了。 Recenlty WaveGAN和SpecGAN被圣地亚哥大学的研究人员用来生成有意义的音频数据() 拟议制度 用法 先决条件 Tensorflow> =
资源推荐
资源详情
资源评论
收起资源包目录
DLJeju2018CodeRepoASR-master.zip (18个子文件)
DLJeju2018CodeRepoASR-master
dependencies
install.md 481B
literature_survey
images
wavegan_results.png 1.59MB
tacotron2.png 107KB
wavegan.png 13KB
audio_reconstruction.md 325B
Litrature.md 1KB
src
src 0B
images
Architecture1.jpeg 47KB
Architecture2.jpeg 33KB
.idea
misc.xml 209B
workspace.xml 10KB
DLJeju2018CodeRepoASR.iml 398B
inspectionProfiles
profiles_settings.xml 228B
modules.xml 294B
vcs.xml 180B
LICENSE 1KB
README.md 5KB
data
sample 0B
共 18 条
- 1
资源评论
蓝精神
- 粉丝: 26
- 资源: 4721
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于python实现的多线程爬虫爬取电影天堂资源
- 基于MFC的教职工信息管理系统c++源码含代码注释.zip
- 毕业设计-基于Vue + Node的外卖系统设计与实现
- python烟花代码示例
- 中国各地级市工业三废数据(2006-2021年).xlsx
- 基于MFC的校园导航程序(使用最短路径dijkstra算法).rar
- Android Studio android APP 视频作为视图背景需要源代码或想了解其实现原理的可以私心我
- com.ZeroneGames.GreenProject.apk
- Python自动化开发入门教程
- 4399GameSem_116_13955_207551_6.apk
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功