没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
本文目的:基于 kaggle 上狗的种类识别项目,展示如何利用 PyTorch 来进行模型
微调。
PyTorch 中 torchvision 是一个针对视觉领域的工具库,除了提供有大量的数据集,
还有许多预训练的经典模型。这里以官方训练好的 resnet50 为例,拿来参加 kaggle
上面的 dog breed 狗的种类识别。
1 导入相关库,设置一些超参
import torch
import torchvision
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader
from torchvision import datasets, models, transforms
import pandas as pd
import os
from PIL import Image
from sklearn.model_selection import StratifiedShuffleSplit
print (torch.__version__) #1.1.0
基于 spring boot 框架项目研发
1 / 17
print (torchvision.__version__) #0.3.0
#定义一些超参
IMG_SIZE = 224 #模型要求的输入尺寸
IMG_MEAN = [ 0.485 , 0.456 , 0.406 ] #图像预处理中需要的均值和方差
IMG_STD = [ 0.229 , 0.224 , 0.225 ]
DEVICE = torch.device( 'cuda' if torch.cuda.is_available() else
'cpu' ) #尽量使用 GPU
BATCH_SIZE = 64 #每一个 batch 的大小
EPOCHS = 7 #训练轮数
2 准备数据
Pytorch 中数据的读取通常需要封装成 Dataset 类对象和 DataLoader 类对象。
2.1 获取数据并整理
首先下载官方的数据并解压,只要保持数据的目录结构即可,这里指定一下目录的
位置,并且看下内容。(注意:labels.csv 文件中有 10222 条标签,对应的是 train
文件夹中图像。)
#DATA_ROOT = r'D:\KaggleDatasets\competitions\dog-breed-identification'
基于 spring boot 框架项目研发
2 / 17
#注 1:常用'/'表相对路径,'\'表绝对路径,网页网址和 linux 系统下一般用'/'
DATA_ROOT = '/KaggleDatasets/competitions/dog-breed-identification'
df = pd.read_csv(os.path.join(DATA_ROOT, 'labels.csv' ))
df.head()
为了后续方便,这里定义两个字典,并将类别序号添加进 DataFrame 中。
#分别以标签字符串和序号为索引,定义两个字典
breeds = df.breed.unique()
breed2idx = dict ((breed,idx) for idx,breed in
enumerate (breeds))
基于 spring boot 框架项目研发
3 / 17
idx2breed = dict ((idx,breed) for idx,breed in
enumerate (breeds))
len (breeds) #120
#将类别序号添加到 df 的列
df[ 'label_idx' ] = pd.Series(breed2idx, index=df.breed).values
#df.shape #(10222, 3)
df.head()
将数据分割成训练集和验证集。这里只分割 10%的数据作为训练时的验证数据。
#分割数据集
剩余16页未读,继续阅读
资源评论
张折耳
- 粉丝: 4975
- 资源: 218
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 采用vue实现的Vue广场乐趣系统.zip
- Qt开发教程&案例&相关项目积分资源.zip
- 基于知识图谱的推荐算法MKR的python实现源码(含项目说明+数据集).zip
- C#开发的高速.NET模板引擎.zip
- 基于知识图谱的推荐算法RippleNet的python实现源码+项目说明+数据集.zip
- ls1x_flash.txt
- 利用MATLAB语言实现PID参数的自动整定,并设计了GUI界面,操作简单.zip
- 基于matlab的量化策略平台.zip
- 基于知识图谱的推荐算法RippleNet的python实现源码+项目说明+数据集(高分项目).zip
- Classical visualbasic language function implementations..zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功