【免费】实践作业，基于卷积神经网络的图像识别.zip资源-CSDN文库

共21个文件

py：8个

ui：3个

h5：2个

人工智能

毕业设计

项目开发

资源资料

需积分: 0 141 浏览量 2024-02-10 16:06:30 上传评论收藏 10.96MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

实践作业，基于卷积神经网络的图像识别.zip （21个子文件）

资料总结

NetJupyterNotes

cifar10_model.ipynb 247KB

Keras_Cifar_ResNet.ipynb 18KB

Core

ImageRecognition.py 3KB

ResultWid.py 1KB

CameraMainWin.py 4KB

SingleResultWid.py 974B

main.py 609B

LICENSE 1KB

.idea

IMG-REC.iml 466B

misc.xml 405B

modules.xml 266B

Qt_Ui

ui_resultWid.py 4KB

resultWid.ui 3KB

singleResultWid.ui 2KB

ui_singleResultWid.py 3KB

cameraWin.ui 3KB

ui_cameraWin.py 4KB

requirement.txt 679B

README.md 7KB

Models

cifar10_ResNet29v2_model.068.h5 10.1MB

cifar100_ResNet20v1_model.155.h5 3.43MB

## 基本功能 - 调用摄像头拍照并识别照片中的物体 - 加载本地图片或包含图片的文件夹逐张识别 ## 环境依赖项目基于python3.6开发，推荐使用pycharm打开。没有将venv依赖包目录加入git上传，请自行安装依赖。 - 安装依赖，在项目根目录下输入`pip install -r requirements.txt` 主要包含以下模块： - opencv或cv2 - PySide2 - keras - tensorflow ## 识别模型说明模型脚本现有两个（Jupyter Notebook编写），`Keras_Cifar_CNN_Introduce.ipynb`是自行设计搭建的CNN网络，结构及性能如下。 ``` _________________________________________________________________ Layer (type) Output Shape Param # ================================================================= conv2d_1 (Conv2D) (None, 32, 32, 32) 896 _________________________________________________________________ dropout_1 (Dropout) (None, 32, 32, 32) 0 _________________________________________________________________ conv2d_2 (Conv2D) (None, 32, 32, 32) 9248 _________________________________________________________________ max_pooling2d_1 (MaxPooling2 (None, 16, 16, 32) 0 _________________________________________________________________ conv2d_3 (Conv2D) (None, 16, 16, 64) 18496 _________________________________________________________________ dropout_2 (Dropout) (None, 16, 16, 64) 0 _________________________________________________________________ conv2d_4 (Conv2D) (None, 16, 16, 64) 36928 _________________________________________________________________ max_pooling2d_2 (MaxPooling2 (None, 8, 8, 64) 0 _________________________________________________________________ conv2d_5 (Conv2D) (None, 8, 8, 128) 73856 _________________________________________________________________ dropout_3 (Dropout) (None, 8, 8, 128) 0 _________________________________________________________________ conv2d_6 (Conv2D) (None, 8, 8, 128) 147584 _________________________________________________________________ max_pooling2d_3 (MaxPooling2 (None, 4, 4, 128) 0 _________________________________________________________________ flatten_1 (Flatten) (None, 2048) 0 _________________________________________________________________ dropout_4 (Dropout) (None, 2048) 0 _________________________________________________________________ dense_1 (Dense) (None, 2500) 5122500 _________________________________________________________________ dropout_5 (Dropout) (None, 2500) 0 _________________________________________________________________ dense_2 (Dense) (None, 1500) 3751500 _________________________________________________________________ dropout_6 (Dropout) (None, 1500) 0 _________________________________________________________________ dense_3 (Dense) (None, 200) 300200 _________________________________________________________________ dropout_7 (Dropout) (None, 200) 0 _________________________________________________________________ dense_4 (Dense) (None, 10) 2010 ================================================================= Total params: 9,463,218 Trainable params: 9,463,218 Non-trainable params: 0 _________________________________________________________________ ``` `Keras_Cifar_ResNet.ipynb`是Kares官网上提供的ResNet程序，包含V1和V2两个版本。自设计的模型由于全连接层较多训练好的模型大约有100MB，就不放在repo里了，训练大约10分钟可以跑完200个epoch（batch_size=500），结果如下： **val_acc: 0.8215** **scores: 0.8128** crosstab: | lab\pre | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | | :----: | :----: | :----: | :----: |:----: |:----: | :----: | :----: | :----: | :----: | :----: | | 0 | 797 | 8 | 62 | 18 | 9 | 5 | 13 | 3 | 72 | 13 | | 1 | 7 | 933 | 4 | 5 | 3 | 1 | 4 | 0 | 7 | 36 | | 2 | 29 | 0 | 775 | 34 | 58 | 34 | 51 | 9 | 10 | 0 | | 3 | 13 | 2 | 69 | 693 | 35 | 112 | 51 | 16 | 5 | 4 | | 4 | 9 | 1 | 57 | 57 | 792 | 23 | 39 | 21 | 1 | 0 | | 5 | 1 | 45 | 184 | 25 | 697 | 13 | 26 | 2 | 1 | | 6 | 3 | 3 | 36 | 51 | 19 | 15 | 869 | 0 | 4 | 0 | | 7 | 10 | 2 | 26 | 49 | 57 | 35 | 2 | 813 | 1 | 5 | | 8 | 32 | 13 | 13 | 17 | 8 | 2 | 6 | 3 | 898 | 8 | | 9 | 18 | 60 | 6 | 23 | 4 | 1 | 10 | 4 | 13 | 861 | 当前得到的效果较优的模型文件`cifar10_ResNet29v2_model.068.h5`，是`Keras_Cifar_ResNet.ipynb`脚本采用Cifar10数据集在Google Colab上进行训练（Python3&GPU加速），迭代70个epoch，择取验证集最佳的一次（第68次，val_acc=85.65%），训练过程约1小时。 ## 使用说明 - 安装环境依赖 - 运行根目录下的`main.py` 项目默认加载相对路径中的`Images`文件夹来打开图片或图片文件夹，默认加载`Models/cifar10_ResNet29v2_model.068.h5`作为打开项目时的使用的模型，如有需要请自行修改`Core/CameraMainWin.py`和`Core/ImageRecognition.py` ## 项目结构 ``` IMG-REC ├── Core │ ├── CameraMainWin.py # 主界面逻辑 │ ├── ImageRecognition.py # 图片识别类 │ ├── ResultWid.py # 多张图片识别结果页面逻辑 │ └── SingleResultWid.py # 单张图片识别结果页面逻辑 ├── Images # 图片集默认打开此文件夹 │ ├── dataset3 # 网上找的图片集 │ └── myset # 自己拍摄的图片集 ├── Models # 训练好的模型 │ ├── cifar100_ResNet20v1_model.155.h5 # 数据集_网络结构_训练次数 │ └── cifar10_ResNet29v2_model.068.h5 # 代码默认加载的模型 ├── NetJupyterNotes │ ├── cifar10_model.ipynb # 自行设计编写的模型脚本 │ └── Keras_Cifar_ResNet.ipynb # Keras官网的ResNet示例脚本 ├── Qt_Ui # QtDesigner生成的布局文件和py-uic转换后的布局脚本 │ ├── cameraWin.ui │ ├── resultWid.ui │ ├── singleResultWid.ui │ ├── ui_cameraWin.py │ ├── ui_resultWid.py │ └── ui_singleResultWid.py ├── LICENSE ├── main.py ├── README.md └── requirement.txt ``` ## 作者和版权声明本项目采用[MIT协议](https://github.com/Jyunmau/IMG-REC/blob/master/LICENSE)。项目程序主逻辑及打包发布和resnet训练由@Jyunmau完成。自建模型设计及训练由@cagaha完成。

评论收藏

内容反馈