# 肢 体 动 作 识 别
-----
<br>
第二个模块是肢体动作识别模块:<br>
我们选用Kaggle比赛的数据库进行预训练,由于图片大小为640*480,因此我们选用了VGGNet模型;<br>
由于VGGNet层次非常深,我们手中的设备很难训练如此复杂的网络(主要是显存不够),因此我们采用了Fine-tuned技术来加速训练<br>
所谓Fine-tuned技术,就是加载别人已经训练好的模型(这里用的是ImageNet上与训练好的VGGNet)<br>
把VGG中前面的卷积层全部冻结,不进行训练(这是由于卷积层是用来提取高阶抽象特征的,图像的组成部分大都差不多,因此可以直接加载)<br>
第二就是卷积层在做BP算法的时候计算复杂很多,会用到广义傅立叶变换,速度非常慢<br>
因此冻结卷积层可以加速训练,相当于只训练全连接层<br>
更多关于Fine-tuned技术:https://kratzert.github.io/2017/02/24/finetuning-alexnet-with-tensorflow.html<br>
<br>
<br>
<br>
核心技术介绍完了就可以开始训练了,数据集来源:https://www.kaggle.com/c/state-farm-distracted-driver-detection <br> <br>
train目录是给我们训练用的目录,里面一共有c0到c9十个分类,对应我们刚刚列出的 0.正常开车 1.右手玩手机 2.右手打电话 等十种行为。在这个训练集中一共包含22,286张图片。 <br> <br> <br> <br>
训练的时候就开始无限踩坑了,其中最重要的是、、、我们的显卡只有3G显存,每次每个batch只能放3个样本,不然就炸了,而且全连接层结点只能是512*256,不然就跑不了了<br><br>
没办法只能硬着头皮跑了,结果损失卡在【2.3】死活下不去,测试集精度也只有10%、、、完全没用<br>
<br>
找了一周的bug,各种方法都试过了,都没用<br>
没办法,怀疑到batch size太小,又申请了一块高级的图形显卡,有8G<br>
修改了batch size大小,把网络改成了700多个隐藏结点,然后损失就下去了???????<br>
我说的轻松,但这一步花了一个月的时间,尝试了各种方法,其中冷暖自知啊<br>
<br><br><br><br>
然后在实验室跑了一天,模型验证集精度能到99%,测试集也差不多90%的样子,可以认为训练好了<br>
<br><br><br>
然后开始用我们的照片进行微调,这个过程很顺利,没用多久就可以使用了<br>
<br><br>
这个模块差不多就做好了<br>
<br><br><br><br><br>
1.load_transfer_Data.py--------------数据预处理1<br><br>
2.loadData.py--------------数据预处理2<br><br>
3.VGGNet_19.py--------------VGG模型<br><br>
4,vgg16.py/vgg19.py---------加载ImageNet上预训练好的模型(这个模型需要自己下载了,太大没法上传)<br><br>
5.VGGNet_19_testSet.py-------测试代码<br><br>
6.opencv.py--------OpenCV驱动摄像头<br><br>
7.VGGNet_19_camera.py-------从摄像头捕捉图像并预测label<br><br>
8.logs----------tensorboard保存结点<br><br>
9.VGGNet_19-------ImageNet预训练好的模型(太大无法上传)<br><br>
10.model-------训练好的模型(太大无法上传)<br><br>
<br><br><br><br>
tips:<br>
foxmail: [email protected]<br>
gamil: [email protected]<br>
others: [email protected]<br>
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
毕业设计:基于深度学习的驾驶者行为监测预警系统,中南大学信息院与交通院合作实现,项目进行中.zip (43个子文件)
Graduation Design
.DS_Store 10KB
.gitattributes 66B
语音识别
__init__.py 0B
.DS_Store 8KB
Voices
.DS_Store 6KB
getVoice.py 2KB
Voice2text.py 1KB
__pycache__
Voice2text.cpython-36.pyc 1KB
__init__.cpython-36.pyc 184B
Text
.DS_Store 6KB
README.md 415B
面部状态识别
__init__.py 0B
.DS_Store 8KB
loadData.py 853B
CNN_NO.1_prediction.py 8KB
Saver
.DS_Store 6KB
DataSet
.DS_Store 6KB
loadTest.py 3KB
twoStream_CNN.py 7KB
CNN_NO.1_test.py 8KB
logs
.DS_Store 6KB
fer2013
.DS_Store 6KB
README.md 2KB
CNN_NO.1.py 10KB
技术报告.pdf 19.4MB
肢体动作识别
VGGNet_19_testSet.py 7KB
__init__.py 0B
.DS_Store 8KB
vgg16.py 2KB
VGGNet_19_prediction.py 6KB
opencv.py 311B
VGGNet_19
.DS_Store 6KB
loadData.py 1KB
loadTest.py 3KB
VGGNet_19.py 11KB
model
.DS_Store 6KB
logs
.DS_Store 6KB
vgg19.py 3KB
load_transfer_Data.py 2KB
README.md 3KB
VGGNet_19_camera.py 10KB
README.md 2KB
技术文档.pdf 2.85MB
共 43 条
- 1
资源评论
学术菜鸟小晨
- 粉丝: 1w+
- 资源: 4940
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 937712277954201实习5.word
- 2程序语言基础知识pdf1_1716337722703.jpeg
- 简单的Python示例,演示了如何使用TCP/IP协议进行基本的客户端和服务器通信
- 考试.sql
- keil2 + proteus + 8051.exe
- 1961ee27df03bd4595d28e24b00dde4e_744c805f7e4fb4d40fa3f695bfbab035_8(1).c
- mediapipe-0.9.0.1-cp37-cp37m-win-amd64.whl.zip
- windows注册表编辑工具
- mediapipe-0.9.0.1-cp37-cp37m-win-amd64.whl.zip
- 校园通行码预约管理系统20240522075502
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功