最新卷积网络架构嵌入各种注意力机制.zip资源-CSDN文库

共27个文件

py：21个

pyc：4个

keep：1个

版权申诉

卷积神经网络

python

5星 · 超过95%的资源 139 浏览量 2022-04-22 19:37:57 上传评论 2 收藏 60KB ZIP 举报

卷积神经网络（CNN，Convolutional Neural Network）是一种深度学习模型，因其在图像处理领域中的卓越性能而广受欢迎。近年来，随着深度学习的发展，研究人员不断探索如何改进CNN的结构，提高其对输入数据的表达能力和泛化能力。在"最新卷积网络架构嵌入各种注意力机制.zip"这个压缩包中，我们很可能找到了一个大学生的大二课程设计项目，它涉及到了CNN与各种注意力机制的结合。我们需要理解卷积网络的基本原理。CNN由卷积层、池化层、全连接层等组成，其中卷积层通过滤波器（或称卷积核）对输入图像进行特征提取，池化层则用于降低数据维度，减少计算量，全连接层则将提取的特征用于分类或回归任务。然而，传统的CNN可能会忽视某些重要区域或特征，这正是注意力机制的作用所在。注意力机制（Attention Mechanism）源自自然语言处理领域，其灵感来源于人类的认知过程，即在处理复杂信息时能集中注意力于关键部分。在CNN中，注意力机制可以引导模型更加关注输入图像中的重要部分，忽略不重要的背景信息。有多种注意力机制可供选择，如自注意力（Self-Attention）、通道注意力（Channel Attention）、空间注意力（Spatial Attention）等。 1. **自注意力**：在特征图上计算每个位置与其他位置的相关性，形成注意力权重，再根据这些权重对特征进行加权求和，从而强化重要特征。 2. **通道注意力**：例如SE模块（Squeeze-and-Excitation Networks），先全局池化提取特征图的通道统计信息，再通过非线性函数（如sigmoid）生成通道权重，对特征图的每个通道进行调整。 3. **空间注意力**：如CBAM（Convolutional Block Attention Module），分别在通道和空间维度上应用注意力机制，提升模型对局部细节的捕捉能力。在这个课程设计项目中，"CNXA-master"可能是一个包含源代码和模型实现的目录。学生可能使用Python作为编程语言，结合TensorFlow、PyTorch或其他深度学习框架构建了包含上述注意力机制的CNN模型。通过实验和调整，他们可能探讨了不同注意力机制如何改善模型的性能，以及如何优化网络结构以适应特定任务。这个项目是一个很好的实践，它不仅涉及到卷积网络的基础理论，还涵盖了当前热门的注意力机制研究，对于理解和应用深度学习有着重要的价值。对于学习者而言，通过这个项目可以深入理解如何在实际问题中融合并优化不同的模型组件，提高模型的性能。

资源推荐

资源详情

资源评论

收起资源包目录

最新卷积网络架构嵌入各种注意力机制.zip （27个子文件）

CNXA-master

CNXA_V2

model

convNeXt.py 7KB

convNeXt_SA.py 8KB

convNeXt_CA.py 8KB

convNeXt_CASA.py 9KB

train.py 18KB

utils

utils.py 3KB

data_loader.py 1KB

transform.py 1KB

data_manger.py 3KB

CNXA_V1

train_casa.py 16KB

train_sa.py 16KB

model

convNeXt.py 7KB

convNeXt_SA.py 7KB

convNeXt_CA.py 8KB

convNeXt_CASA.py 9KB

train.py 16KB

train_ca.py 16KB

utils

utils.py 3KB

data_loader.py 1KB

__pycache__

data_manger.cpython-38.pyc 2KB

utils.cpython-38.pyc 4KB

transform.cpython-38.pyc 1KB

data_loader.cpython-38.pyc 1KB

transform.py 1KB

data_manger.py 3KB

介绍.txt 5KB

CNXA_V3

.keep 0B

# 最新卷积网络架构嵌入各种注意力机制 #### 介绍现在只有V1、V2版本，最终版本即将完成，近期会会上传。在2022年的ConvNeXt-base网络的工作上，添加各种注意力机制网络，得到的新网络主干比原网络在ImageNet100数据集上高出0.5 ± 0.3的精确度。 # pytorch实现现阶段主流分类网络 ### 目录 1. [所需环境 Environment](#所需环境) 2. [文件下载 Download](#文件下载) 3. [训练步骤 How2train](#训练步骤) 4. [预测步骤 How2predict](#预测步骤) 5. [评估步骤 How2eval](#评估步骤) ### 所需环境 pytorch >= 1.12.0 + CUDA >= 11.0 推荐使用docker环境在linux上运行，基于此项目的docker镜像请[点击](https://pan.baidu.com/s/1963dCct6ZERe2PB1vVDohQ?pwd=lgbd )下载. 提取码：lgbd。此步骤必须得了解些许linux命令已经docker基础。 ######使用docker步骤(默认linux上已经安装docker)： 1. 下载好提供的docker镜像(cnx_v3.tar)，通过xfpt或者winSCP等软件或技术传入到linux中； 2. 命令行输入 docker load -i cnx_v3.tar，等待镜像导入完成； 3. 导入完成后，输入docker images查看； 4. 将此项目的代码文件夹也传入到linux中，比如传入到 /home/Code/中； 5. 在linux中进入到 /home/Code目录； 6. 命令行输入：docker run -it --rm --gpus all --shm-size 6g -v $PWD:/data/ cnx_v3:latest /bin/bash； 7. 进入后cd /data/进入到项目目录，至此运行步骤请参考以下内容； 8. 如果有docker高手，请自行设置参数以及映射到docker里面。 ### 文件下载模型文件(loss与val_loss都取最小) | name | resolution |top1 |top5 |#params | FLOPs | model | |:---:|:---:|:---:|:---:|:---:| :---:|:---:| | CNX | 224x224 | 89.46% | 97.14% | 87.163M| 15.359G| [model](https://pan.baidu.com/s/1rISHEiEDD82rcuH_OHd98Q?pwd=8pk3)| | ViT | 224x224 | 89.33% | 98.00% | 85.723M | 16.856G | [model](https://pan.baidu.com/s/1YvUL3JueJD7eD3smCEVbCQ?pwd=qpy6)| | CNXAECANET | 224x224 | 90.34% | 97.32%| 87.613M| 15.359G| [model](https://pan.baidu.com/s/1K5yD4YACB4r_EJ-_hsRElQ?pwd=mct3)| | CNXASENET | 224x224 | 89.68% | 97.31% |87.745M | 15.359G|[model](https://pan.baidu.com/s/1XTsPJahl3juTzIK0gHvctg?pwd=4s2v)| | CNXACA | 224x224 | 89.89% | 97.29%|87.745M | 15.360G|[model](https://pan.baidu.com/s/12v6FY2rZT6gD99CvWwfrFg?pwd=hi7e)| | CNXASA | 224x224 | 89.86% | 97.19%|87.613M| 15.359G|[model](https://pan.baidu.com/s/1RFgCeTEzfhJkmbD_-3O-iw?pwd=cqhx)| | CNXACASA | 224x224 | 90.24% | 97.64%|87.745M| 15.360G|[model](https://pan.baidu.com/s/1SSL9kFyF-Vmqidbf8tlzvA?pwd=cxqp)| | CNXABK | 224x224 | 88.96% | 97.50%|246.867M| 16.097G|[model](https://pan.baidu.com/s/1QkubPXYbczo4gnoa-yWsqw?pwd=90b9)| 模型文件(只取val_loss都取最小) | name | resolution |top1 |top5 |#params | FLOPs | model | |:---:|:---:|:---:|:---:|:---:| :---:|:---:| | CNX | 224x224 | 97.43% | 99.77% | 87.163M| 15.359G|[model](https://pan.baidu.com/s/1M3G3pn1_NB5VXUWFKFayyA?pwd=tqsv)| | ViT | 224x224 | 89.94% | 98.33%| 85.723M | 16.856G |[model](https://pan.baidu.com/s/1n0d4ZfIutIxmwtTC2mCnIg?pwd=vlpa)| | CNXAECANET | 224x224 | 97.68% | 99.78% | 87.613M| 15.359G|[model](https://pan.baidu.com/s/1ri0RYfotyXXzVaJ2Dsxavg?pwd=i17o)| | CNXASENET | 224x224 | 97.86% | 99.79% | 87.745M | 15.359G|[model](https://pan.baidu.com/s/14en5RdhqtwN5R2cxIc0PHg?pwd=swew)| | CNXACA | 224x224 | 97.86% |99.69% |87.745M | 15.360G|[model](https://pan.baidu.com/s/1ke8cOdRLzSQpZEa9R1pXXw?pwd=6hfl)| | CNXASA | 224x224 | 97.46% |99.71% |87.613M| 15.359G|[model](https://pan.baidu.com/s/1eTv1HToevL8gRFk2lruegg?pwd=xn7w)| | CNXACASA | 224x224 | 97.51% | 99.62%|87.745M| 15.360G|[model](https://pan.baidu.com/s/19zxVpiDrmllLIXi9UutuPA?pwd=k4ba)| | CNXABK | 224x224 | 98.02% | 99.72%|246.867M| 16.097G|[model](https://pan.baidu.com/s/13zIzf6Lw4Uec0LVysTs54A?pwd=t4yr)| 数据集ImageNet100下载请[点击](https://pan.baidu.com/s/1KbRhZrV2xjGWMUjw0yTXIQ?pwd=pcai ) 提取码：pcai ### 训练步骤 1. 准备数据集(ImageNet100)，格式如下： ``` |-datasets |-xxx |-classes_one |-123.jpg |-234.jpg |-classes_two |-345.jpg |-456.jpg |-... ``` 修改 create_txt.py中的root=" "；运行 python create_txt.py生成cls_test.txt用于评估，cls_train.txt用于训练。 2. 修改train.py中的classes_path、backbone、aa、model_path以及一些超参数。运行 python train.py 进行训练。 ### 预测步骤 1. 在classification.py文件里面，在如下部分修改model_path、classes_path、backbone和alpha使其对应训练好的文件；**model_path对应logs文件夹下面的训练好的模型，classes_path是model_path对应分的类，backbone对应使用的主干特征提取网络。一般挑val_loss最小的进行预测，或者挑选loss和val_loss都是最小的进行预测。 2. 运行 python predict.py,在终端输入图片所在位置即可进行预测。 ### 评估步骤 1. 由于已经生成cls_test.txt评估文件； 2. 之后在classification.py文件里面修改如下部分model_path、classes_path、backbone和alpha使其对应训练好的文件；**model_path对应logs文件夹下面的权值文件，classes_path是model_path对应分的类，backbone对应使用的主干特征提取网络； 3. 运行python eval_top1.py 和 python eval_top5.py； 4. 精度结果生成在evaluate_result里面可自行查看。

评论收藏

内容反馈

版权申诉