## Classification:分类模型在Pytorch当中的实现
---
## 目录
1. [所需环境 Environment](#所需环境)
2. [文件下载 Download](#文件下载)
3. [预测步骤 How2predict](#预测步骤)
4. [训练步骤 How2train](#训练步骤)
5. [评估步骤 How2eval](#评估步骤)
6. [参考资料 Reference](#Reference)
## 所需环境
pytorch == 1.2.0
## 文件下载
训练所需的预训练权重都可以在百度云下载。
链接: https://pan.baidu.com/s/1KwH-O7EafSpfPXnCyX_DVw
提取码: 2g5y
训练所用的示例猫狗数据集也可以在百度云下载。
链接: https://pan.baidu.com/s/1Jz1nafsrRcw2Hqso4c8i0g
提取码: hmmx
## 预测步骤
### a、使用预训练权重
1. 下载完库后解压,model_data已经存在一个训练好的猫狗模型mobilenet025_catvsdog.h5,运行predict.py,输入
```python
img/cat.jpg
```
### b、使用自己训练的权重
1. 按照训练步骤训练。
2. 在classification.py文件里面,在如下部分修改model_path、classes_path、backbone和alpha使其对应训练好的文件;**model_path对应logs文件夹下面的权值文件,classes_path是model_path对应分的类,backbone对应使用的主干特征提取网络,alpha是当使用mobilenet的alpha值**。
```python
_defaults = {
"model_path" : 'model_data/mobilenet_catvsdog.pth',
"classes_path" : 'model_data/cls_classes.txt',
"input_shape" : [224,224,3],
"backbone" : 'mobilenet',
"cuda" : True
}
```
3. 运行predict.py,输入
```python
img/cat.jpg
```
## 训练步骤
1. datasets文件夹下存放的图片分为两部分,train里面是训练图片,test里面是测试图片。
2. 在训练之前需要首先准备好数据集,在train或者test文件里里面创建不同的文件夹,每个文件夹的名称为对应的类别名称,文件夹下面的图片为这个类的图片。文件格式可参考如下:
```
|-datasets
|-train
|-cat
|-123.jpg
|-234.jpg
|-dog
|-345.jpg
|-456.jpg
|-...
|-test
|-cat
|-567.jpg
|-678.jpg
|-dog
|-789.jpg
|-890.jpg
|-...
```
3. 在准备好数据集后,需要在根目录运行txt_annotation.py生成训练所需的cls_train.txt,运行前需要修改其中的classes,将其修改成自己需要分的类。
4. 之后修改model_data文件夹下的cls_classes.txt,使其也对应自己需要分的类。
5. 在train.py里面调整自己要选择的网络和权重后,就可以开始训练了!
## 评估步骤
1. datasets文件夹下存放的图片分为两部分,train里面是训练图片,test里面是测试图片,在评估的时候,我们使用的是test文件夹里面的图片。
2. 在评估之前需要首先准备好数据集,在train或者test文件里里面创建不同的文件夹,每个文件夹的名称为对应的类别名称,文件夹下面的图片为这个类的图片。文件格式可参考如下:
```
|-datasets
|-train
|-cat
|-123.jpg
|-234.jpg
|-dog
|-345.jpg
|-456.jpg
|-...
|-test
|-cat
|-567.jpg
|-678.jpg
|-dog
|-789.jpg
|-890.jpg
|-...
```
3. 在准备好数据集后,需要在根目录运行txt_annotation.py生成评估所需的cls_test.txt,运行前需要修改其中的classes,将其修改成自己需要分的类。
4. 之后在classification.py文件里面修改如下部分model_path、classes_path、backbone和alpha使其对应训练好的文件;**model_path对应logs文件夹下面的权值文件,classes_path是model_path对应分的类,backbone对应使用的主干特征提取网络,alpha是当使用mobilenet的alpha值**。
```python
_defaults = {
"model_path" : 'model_data/mobilenet_catvsdog.pth',
"classes_path" : 'model_data/cls_classes.txt',
"input_shape" : [224,224,3],
"backbone" : 'mobilenet',
"cuda" : True
}
```
5. 运行eval_top1.py和eval_top5.py来进行模型准确率评估。
## Reference
https://github.com/keras-team/keras-applications
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
基于openpose和图像分类的手语识别项目python源码+项目使用说明(毕设项目).zip 【实现方法】 法一: 将视频输入到openpose中,检测出关节点的变化轨迹,将轨迹绘制在一张图片上,把这张图片传到图像分类网络中检测属于哪个动作 视频 -> | openpose |--> 关节点运动轨迹图-> | 图像分类模型 |-> 单词分类 方法二: 将视频输入到openpose中,检测出每一帧中关节点的位置,将多帧进行堆叠,形成一个三维张量,其中两个维度是图片的宽和高,一个维度是时间,然后对这个三维张量使用三维卷积进行训练和预测 视频 -> openpose -> 多张关节点位置图 -> | 堆叠 | -> 三维张量 -> | 三维卷积网络 | -> 单词分类 【环境配置】 python:3.7(其他版本会导致openpose无法运行,建议使用anaconda的python环境) cuda:10 cudnn:7或8应该都行
资源推荐
资源详情
资源评论
收起资源包目录
基于openpose和图像分类的手语识别项目python源码+项目使用说明(毕设项目).zip (108个子文件)
video.avi 1.33MB
getModels.bat 2KB
18_synchronous_custom_all_and_datum.cpp 17KB
13_asynchronous_custom_input_output_and_datum.cpp 16KB
05_keypoints_from_images_multi_gpu.cpp 15KB
12_asynchronous_custom_output.cpp 13KB
17_synchronous_custom_output.cpp 13KB
08_heatmaps_from_image.cpp 12KB
09_keypoints_from_heatmaps.cpp 12KB
07_hand_from_image.cpp 12KB
06_face_from_image.cpp 11KB
11_asynchronous_custom_input_multi_camera.cpp 11KB
04_keypoints_from_images.cpp 10KB
14_synchronous_custom_input.cpp 10KB
10_asynchronous_custom_input.cpp 10KB
03_keypoints_from_image.cpp 10KB
16_synchronous_custom_postprocessing.cpp 10KB
15_synchronous_custom_preprocessing.cpp 10KB
01_body_from_image_default.cpp 5KB
02_whole_body_from_image_default.cpp 4KB
1.作品简介.doc 24KB
3.安装说明.docx 16KB
17012332.xml.example 825B
COCO_val2014_000000000395.jpg 241KB
COCO_val2014_000000000192.jpg 225KB
COCO_val2014_000000000257.jpg 204KB
COCO_val2014_000000000459.jpg 190KB
COCO_val2014_000000000544.jpg 184KB
COCO_val2014_000000000328.jpg 156KB
COCO_val2014_000000000474.jpg 128KB
COCO_val2014_000000000357.jpg 128KB
COCO_val2014_000000000564.jpg 127KB
COCO_val2014_000000000569.jpg 127KB
COCO_val2014_000000000360.jpg 116KB
COCO_val2014_000000000415.jpg 115KB
COCO_val2014_000000000623.jpg 110KB
COCO_val2014_000000000241.jpg 105KB
COCO_val2014_000000000488.jpg 103KB
COCO_val2014_000000000428.jpg 100KB
COCO_val2014_000000000589.jpg 95KB
COCO_val2014_000000000338.jpg 80KB
COCO_val2014_000000000294.jpg 74KB
track_of_point.jpg 62KB
dog.jpg 23KB
COCO_val2014_000000000536.jpg 22KB
cat.jpg 9KB
README.md 4KB
项目说明.md 3KB
README.md 270B
README.md 267B
README.md 24B
test4_60fps.mp4 3.06MB
test5.mp4 759KB
test4.mp4 290KB
test3.mp4 191KB
keypoints_hand.png 181KB
keypoints_pose_25.png 70KB
pose_deploy_linevec.prototxt 45KB
pose_deploy_linevec.prototxt 45KB
pose_deploy.prototxt 41KB
pose_deploy_linevec_faster_4_stages.prototxt 31KB
pose_deploy.prototxt 26KB
pose_deploy.prototxt 25KB
Epoch50-Total_Loss0.0870-Val_Loss0.0343.pth 8.69MB
train.py 10KB
resnet50.py 7KB
mobilenet.py 5KB
05_keypoints_from_images_multi_gpu.py 4KB
classification_pose.py 4KB
classification.py 4KB
07_hand_from_image.py 4KB
08_heatmaps_from_image.py 4KB
test_video_track_point.py 3KB
09_keypoints_from_heatmaps.py 3KB
04_keypoints_from_images.py 3KB
12_asynchronous_custom_output.py 3KB
06_face_from_image.py 3KB
vgg16.py 3KB
02_whole_body_from_image.py 3KB
dataloader.py 3KB
01_body_from_image.py 3KB
openpose_python.py 3KB
eval_top5.py 2KB
eval_top1.py 2KB
utils.py 1KB
test_video.py 1KB
test.py 1KB
txt_annotation.py 1KB
predict.py 370B
test.py 275B
resnet50.cpython-37.pyc 5KB
mobilenet.cpython-37.pyc 4KB
classification_pose.cpython-37.pyc 3KB
classification_copy.cpython-37.pyc 3KB
classification.cpython-37.pyc 3KB
classification_copy.cpython-38.pyc 3KB
classification.cpython-38.pyc 3KB
dataloader.cpython-37.pyc 3KB
vgg16.cpython-37.pyc 3KB
utils.cpython-37.pyc 2KB
共 108 条
- 1
- 2
极客程序设计
- 粉丝: 7184
- 资源: 3585
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
- 3
前往页