## Vision Transformer(ViT)
# 代码会自动载入预训练权重
1. 准备好自定义数据集,按照下面格式摆放
data-train---后面跟文件夹,每个文件夹里面存放相同的图像,几个文件夹代表几个分类
data-test
2. 在 `train.py` 脚本中更改下面超参数
# num_classes 必须根据分类的个数进行更改 !!!其他的看着改
parser.add_argument('--num-classes', type=int, default=5)
parser.add_argument('--epochs', type=int, default=100)
parser.add_argument('--batch-size', type=int, default=16)
parser.add_argument('--lr', type=float, default=0.001)
parser.add_argument('--lrf', type=float, default=0.01)
parser.add_argument('--freeze-layers', type=bool, default=True) # 是否冻结权重
3.`predict.py`脚本会自动预测 inference 文件夹下的所以图片
# 下面的三个都要更改,num_classes 是自己分类的个数
# mean,std 是训练图片的均值和方差,训练的时候会生成,copy在这里就行('./run_results/train_log_results.txt' 文件里也有)
num_classes = 5
main(mean=mean,std=std,num_classes=num_classes)
没有合适的资源?快使用搜索试试~ 我知道了~
基于pytorch实现的 vision transformer的图像分类 完整代码+预训练权重【可直接运行 毕业设计】
共15个文件
xml:4个
py:4个
pyc:2个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 174 浏览量
2024-07-29
02:05:56
上传
评论
收藏 302.83MB 7Z 举报
温馨提示
在本项目中,我们探讨了如何使用PyTorch框架中的Vision Transformer(ViT)进行图像分类。PyTorch是一个流行的深度学习库,它提供了丰富的功能和灵活性,非常适合进行复杂的模型开发,如Transformer架构。Transformer最初是为自然语言处理(NLP)任务设计的,但最近已经被成功应用于计算机视觉(CV)领域。 Vision Transformer (ViT):ViT是Transformer在图像分类领域的应用,它打破了传统的卷积神经网络(CNN)的局限。ViT将图像分割成固定大小的patches,然后将这些patches转换为一维向量,输入到Transformer的编码器中。Transformer通过自注意力机制捕获全局上下文信息,这在处理图像时非常有效。 更多网络介绍或者更换数据集进行迁移学习训练请参考readme文件
资源推荐
资源详情
资源评论
收起资源包目录
vision_transformer.7z (15个子文件)
vision_transformer
utils.py 6KB
inference
weights
vit_base_patch16_224_in21k.pth 393.65MB
predict.py 2KB
model.py 18KB
.idea
vision_transformer.iml 491B
workspace.xml 6KB
misc.xml 294B
inspectionProfiles
profiles_settings.xml 174B
modules.xml 295B
.gitignore 50B
requirements.txt 156B
train.py 8KB
__pycache__
model.cpython-38.pyc 14KB
utils.cpython-38.pyc 5KB
README.md 1KB
共 15 条
- 1
资源评论
听风吹等浪起
- 粉丝: 1w+
- 资源: 1895
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- GEE Python:Landsat和VITO时序NDVI的加载和对比和预测(最小二乘).ipynb
- 马尔科夫决策过程.docx
- Screenshot_2024-09-08-18-26-07-106_com.tencent.mm.jpg
- contract.pdf
- 这是一张客户档案信息表模板,可登记客户基本资料和财务资料以及各年度汇款情况
- 本地音乐播放器优化版源码20240908
- scratch小游戏(能运行)
- Matlab根据flac、pfc或其他软件导出的坐标及应力、位移数据再现云图 案例包括导出在flac6.0中导出位移的fish代
- 入职一个月的感受,所需要的资源
- 使用批处理脚本调用ModelSim软件对Vivado的设计内容进行仿真的模版
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功