- [项目概述](#项目概述)
- [一,数学基础专栏](#一数学基础专栏)
- [二,神经网络基础部件](#二神经网络基础部件)
- [三,深度学习炼丹](#三深度学习炼丹)
- [四,深度学习模型压缩](#四深度学习模型压缩)
- [五,模型推理部署](#五模型推理部署)
- [六,异构计算](#六异构计算)
- [七,大语言模型推理及服务化](#七大语言模型推理及服务化)
- [八,进阶课程](#八进阶课程)
- [九,其他](#九其他)
- [Star History](#star-history)
- [参考资料](#参考资料)
## 项目概述
本仓库项目是个人总结的计算机视觉和大语言模型学习笔记,包含深度学习基础知识、神经网络基础部件详解、深度学习炼丹策略、深度学习模型压缩算法、深度学习推理框架代码解析及动手实战,以及 `LLM` 基础及推理优化的专栏笔记。
## 一,数学基础专栏
- [深度学习数学基础-概率与信息论](./1-math_ml_basic/深度学习数学基础-概率与信息论.md)
- [深度学习基础-机器学习基本原理](./1-math_ml_basic/深度学习基础-机器学习基本原理.md)
- [随机梯度下降法的数学基础](./1-math_ml_basic/随机梯度下降法的数学基础.md)
- [Python 编程思维导航](./1-math_ml_basic/python_learn_xmind)
## 二,神经网络基础部件
1,**神经网络基础部件**:
1. [神经网络基础部件-卷积层详解](./2-deep_learning_basic/神经网络基础部件-卷积层详解.md)
2. [神经网络基础部件-BN 层详解](./2-deep_learning_basic/神经网络基础部件-BN层详解.md)
3. [神经网络基础部件-激活函数详解](./2-deep_learning_basic/神经网络基础部件-激活函数详解.md)
2,**深度学习基础**:
- [反向传播与梯度下降详解](2-deep_learning_basic/反向传播与梯度下降详解.md)
- [深度学习基础-参数初始化详解](./2-deep_learning_basic/深度学习基础-参数初始化详解.md)
- [深度学习基础-损失函数详解](./2-deep_learning_basic/深度学习基础-损失函数详解.md)
- [深度学习基础-优化算法详解](./2-deep_learning_basic/深度学习基础-优化算法详解.md)
## 三,深度学习炼丹
1. [深度学习炼丹-数据标准化](./3-deep_learning_alchemy/深度学习炼丹-数据标准化.md)
2. [深度学习炼丹-数据增强](./3-deep_learning_alchemy/深度学习炼丹-数据增强.md)
3. [深度学习炼丹-不平衡样本的处理](./3-deep_learning_alchemy/深度学习炼丹-不平衡样本的处理.md)
4. [深度学习炼丹-超参数设定](./3-deep_learning_alchemy/深度学习炼丹-超参数调整.md)
5. [深度学习炼丹-正则化策略](./3-deep_learning_alchemy/深度学习炼丹-正则化策略.md)
## 四,深度学习模型压缩
1. [深度学习模型压缩算法综述](./4-model_compression/深度学习模型压缩方法概述.md)
2. [模型压缩-轻量化网络设计与部署总结](./4-model_compression/模型压缩-轻量化网络详解.md)
3. [模型压缩-剪枝算法详解](./4-model_compression/模型压缩-剪枝算法详解.md)
4. [模型压缩-知识蒸馏详解](./4-model_compression/模型压缩-知识蒸馏详解.md)
5. [模型压缩-量化算法详解](./4-model_compression/模型压缩-量化算法概述.md)
## 五,模型推理部署
1,模型部署:
- [卷积神经网络复杂度分析](./5-model_deploy/卷积神经网络复杂度分析.md)
- [模型压缩部署概述](./5-model_deploy/模型压缩部署概述.md)
2,模型推理:
- [矩阵乘法详解](./5-model_deploy/卷积算法优化.md)
- [模型推理加速技巧-融合卷积和BN层](./5-model_deploy/模型推理加速技巧-融合卷积和BN层.md)
3,`ncnn` 框架源码解析:
- [ncnn 源码解析-sample 运行](5-model_deploy/ncnn源码解析/ncnn源码解析-sample运行.md)
- [ncnn 源码解析-Net 类](5-model_deploy/ncnn源码解析/ncnn源码解析-Net类.md)
- [ncnn 源码解析-Layer 层](5-model_deploy/ncnn源码解析/ncnn源码解析-Layer层.md)
- [ncnn 源码解析-常见算子](../5-model_deploy/ncnn源码解析/ncnn源码解析-常见算子.md)
**5,AI/NPU/GPU 芯片特性**:
- [英伟达 GPU 架构特性详解](5-model_deploy/英伟达GPU架构详解.md)
## 六,异构计算
1. 移动端异构计算:`neon` 编程
2. GPU 端异构计算:`cuda` 编程
通用矩阵乘法 `gemm` 算法解析与优化、`neon`、`cuda` 编程等内容,以及 `ncnn` 框架代码解析总结。
## 七,大语言模型推理及服务化
**1,LLM 基础知识**:
- [transformers 库快速入门](./6-llm_note/transformer_basic/transformers库快速入门.md)
- [LLM 背景知识总结](./6-llm_note/transformer_basic/LLM背景知识总结.md)
**2,Transformer 模型基础**:
- [Transformer 原理详解](./6-llm_note/transformer_basic/Transformer模型详解及代码实现.md)
- [Transformer 基础视觉模型详解](./6-llm_note/transformer_basic/Transformer视觉模型概述.md)
- [LLaMA 及其子孙模型详解](./6-llm_note/transformer_basic/LLaMA及其子孙模型概述.md)
- [BLOOM 模型结构详解](./6-llm_note/transformer_basic/BLOOM模型结构详解.md)
- [GPT1-3 系列模型总结](./6-llm_note/transformer_basic/GPT1-3系列模型总结.md)
- [CLIP 多模态模型总结](./6-llm_note/transformer_basic/CLIP多模态模型总结.md)
**3,大规模模型的推理优化及部署总结**:
- [Transformer 模型性能分析理论基础](./6-llm_note/llm_inference/Transformer性能分析理论基础.md)
- [FasterTransformer 框架速览](./6-llm_note/llm_inference/FasterTransformer速览.md)
- [LLM 训练的并行策略详解](./6-llm_note/llm_inference/LLM训练的并行策略详解.md)
**4,DeepSpeed 框架学习笔记**:
- [DeepSpeed:通过系统优化和压缩加速大规模模型推理和训练](./6-llm_note/deepspeed_note/DeepSpeed:通过系统优化和压缩加速大规模模型推理和训练.md)
- [DeepSpeed推理:具有定制推理内核和量化支持的多GPU推理](./6-llm_note/deepspeed_note/DeepSpeed推理:具有定制推理内核和量化支持的多GPU推理.md)
- [DeepSpeed:模型压缩模块详解](./6-llm_note/deepspeed_note/DeepSpeed:模型压缩模块详解.md)
## 八,进阶课程
1,推荐几个比较好的深度学习模型压缩与加速的仓库和课程资料:
1. [神经网络基本原理教程](https://github.com/microsoft/ai-edu/blob/master/%E5%9F%BA%E7%A1%80%E6%95%99%E7%A8%8B/A2-%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C%E5%9F%BA%E6%9C%AC%E5%8E%9F%E7%90%86/%E7%AC%AC8%E6%AD%A5%20-%20%E5%8D%B7%E7%A7%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C/17.1-%E5%8D%B7%E7%A7%AF%E7%9A%84%E5%89%8D%E5%90%91%E8%AE%A1%E7%AE%97%E5%8E%9F%E7%90%86.md)
2. [AI-System](https://microsoft.github.io/AI-System/): 深度学习系统,主要从底层方向讲解深度学习系统等原理、加速方法、矩阵成乘加计算等。
3. [pytorch-deep-learning](https://github.com/mrdbourke/pytorch-deep-learning):很好的 pytorch 深度学习教程。
2,一些笔记好的博客链接:
- [The Illustrated Transformer](http://jalammar.github.io/illustrated-transformer/): 国内比较好的博客大都参考这篇文章。
- [C++ 并发编程(从C++11到C++17)](https://paul.pub/cpp-concurrency/): 不错的 C++ 并发编程教程。
- [What are Diffusion Models?](https://lilianweng.github.io/posts/2021-07-11-diffusion-models/)
- [annotated_deep_learning_paper_implementations](https://github.com/labmlai/annotated_deep_learning_paper_implementations)
## 九,其他
最后,持续高质量创作不易,有 `5` 秒空闲时间的,**可以扫码关注我的公众号-嵌入式视觉**,记录 CV 算法工程师成长之路,分享技术总结、读书笔记和个人感悟。
> 公众号不会写标题党文章,也不输出给大家带来的焦虑的内容!
![qcode](images/others/qcode.png)
## Star History
[![Star History Chart](https://api.star-history.com/svg?repos=HarleysZhang/d
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。
资源推荐
资源详情
资源评论
收起资源包目录
深度学习系统笔记,包含深度学习数学基础知识、神经网络基础部件详解、深度学习炼丹策略、模型压缩算法详解 (521个子文件)
class_copy_move.cpp 1KB
cpp_basic.cpp 943B
binary_search.cpp 628B
multi_thread_demo.cpp 608B
Volta-Tensor-Core_30fps_FINAL_994x559.gif 6.3MB
conv_dynamic_visual.gif 391KB
conv_dynamic_visual.gif 391KB
maxpool.gif 245KB
Tangent_function_animation.gif 187KB
conv_visual.gif 134KB
.gitignore 138B
Koalainputimage.jpeg 1.19MB
recognize.jpeg 423KB
1400x788_deepspeed_no_logo_still-1-scaled.jpeg 319KB
ampere-nvlink-nvswitch-2c50-d@2x.jpeg 311KB
nvidia-sparsity-diagram-2c50-d@2x.jpeg 259KB
ampere-multi-instance-gpu-diagram-2c50-d@2x.jpeg 252KB
cnn_demo1.jpeg 212KB
ampere-tensor-cores-chart-2c50-d@2x.jpeg 173KB
DeepSpeedUpdatedTableFinalHighResv1.jpeg 88KB
Fig1_DeepSpeed5_Blog.jpeg 75KB
DeepSpeed_fig2_5blog.jpeg 72KB
llama_structrue.jpeg 58KB
DeepSpeed5_fig5_final.jpeg 57KB
DeepSpeed5_fig4_blog_final.jpeg 56KB
DeepSpeed5_fig6_final.jpeg 56KB
DeepSpeed5_fig3_blog_final.jpeg 54KB
DeepSpeed5_fig7_final.jpeg 48KB
astronaut.jpeg 39KB
layer_norm.jpeg 35KB
multi_head_attention.jpeg 25KB
scale_dot_product_attention.jpeg 16KB
image11.jpg 343KB
视差模型在海思3519平台部署流程.jpg 183KB
image10.jpg 134KB
image10.jpg 134KB
image10.jpg 134KB
image10.jpg 134KB
image9.jpg 102KB
image9.jpg 102KB
image9.jpg 102KB
image9.jpg 102KB
image8.jpg 100KB
image8.jpg 100KB
image8.jpg 100KB
image8.jpg 100KB
image7.jpg 84KB
image7.jpg 84KB
image7.jpg 84KB
image7.jpg 84KB
图十将浮点量化为定点时调整最小值-最大值.jpg 66KB
定点和浮点的格式和示例.jpg 61KB
image6.jpg 60KB
image6.jpg 60KB
image6.jpg 60KB
image6.jpg 60KB
训练和推理.jpg 48KB
roof-line.jpg 23KB
难易正负样本.jpg 12KB
image2.jpg 10KB
image2.jpg 10KB
image2.jpg 10KB
image2.jpg 10KB
image1.jpg 9KB
image1.jpg 9KB
image1.jpg 9KB
image1.jpg 9KB
image5.jpg 9KB
image5.jpg 9KB
image5.jpg 9KB
image5.jpg 9KB
image3.jpg 9KB
image3.jpg 9KB
image3.jpg 9KB
image3.jpg 9KB
image4.jpg 8KB
image4.jpg 8KB
image4.jpg 8KB
image4.jpg 8KB
model_configs.json 4KB
gpu_configs.json 2KB
LICENSE 11KB
courgette.log 0B
tgi框架解析.md 45KB
Transformer性能分析理论基础.md 41KB
英伟达GPU规格总结.md 36KB
卷积神经网络复杂度分析.md 34KB
深度学习数学基础-概率与信息论.md 31KB
Transformer模型详解及代码实现.md 31KB
深度学习基础-机器学习基本原理.md 27KB
DeepSpeed_通过系统优化和压缩加速大规模模型推理和训练.md 26KB
模型压缩-量化算法概述.md 26KB
神经网络基础部件-卷积层详解.md 26KB
Flash Attention 论文翻译.md 25KB
深度学习炼丹-超参数调整.md 25KB
模型压缩-剪枝算法详解.md 22KB
深度学习基础-损失函数详解.md 21KB
gRPC基础笔记.md 21KB
深度学习模型压缩方法概述.md 21KB
FasterTransformer速览.md 19KB
共 521 条
- 1
- 2
- 3
- 4
- 5
- 6
资源评论
毕业小助手
- 粉丝: 2751
- 资源: 5583
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功