【资源说明】 毕业设计-基于pytorch深度学习的声纹识别源码(动漫、游戏)+代码注释+部署说明.zip 声纹识别项目-游戏/动漫 声优识别 注意,本项目经过测试,只能用于无背景音乐下的声纹识别,背景音乐会对结果有很大影响 数据集准备 数据集地址:https://github.com/fighting41love/zhvoice 自己下载下来后,把里面所有的压缩文件都进行解压,解压后结构如下,test_list.txt 和 train_list.txt 是后面生成的,先不管,注意这些训练数据要放到 data 文件夹下。 ├── info ├── metadata.csv ├── readme.md ├── sample ├── test_list.txt ├── text ├── train_list.txt ├── zhaidatatang ├── zhaishell ├── zhbznsyp ├── zhmagicdata ├── zhprimewords ├── zhspeechocean ├── zhstcmds └── zhthchs30 然后我们可以输入 python create_data.py 来对数据集进行处理,这里主要会进行两个操作,第一个是把mp3转换为wav的格式(这个操作比较耗时,可能需要几天),并生成对应的训练数据集文本和测试数据集的文本。第二个是会把一些没用的音频数据删除。 数据集训练 所有的配置信息都在 train.py 里面,自己看着改就可以了,默认情况下不需要改动。 使用 python train.py 就可以开始训练了(RTX3060大概要训练6天时间) 计算 使用 python eval.py 可以计算阈值信息,因为我们是通过余铉距离来计算的进行对比时会得出一个分数,当大于这个分数的时候才可以认为是同一个人。运行后输出的结果如下: 当阈值为0.660000, 准确率最大,为:0.999952 运行 python main.py 安装可能遇到的问题 1. error: portaudio.h: No such file or directory 参考:https://stackoverflow.com/questions/48690984/portaudio-h-no-such-file-or-directory ubuntu20.4 可以参考 sudo apt install portaudio19-dev python3-pyaudio 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
- 1
- m0_663717622024-05-10这个资源内容超赞,对我来说很有价值,很实用,感谢大佬分享~
- 殻zxcvbnm2024-05-03发现一个宝藏资源,赶紧冲冲冲!支持大佬~
- 粉丝: 9971
- 资源: 5626
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助