没有合适的资源?快使用搜索试试~ 我知道了~
GPU算子全流程开发指导.PDF
需积分: 9 1 下载量 188 浏览量
2023-02-28
09:29:05
上传
评论
收藏 9.14MB PDF 举报
温馨提示
试读
41页
GPU算子全流程开发指导.PDF
资源推荐
资源详情
资源评论
Tips
① 此文档详细介绍了 MindSpore GPU 异构算子开发流程,与官方文档相比
本文档更加侧重于开发文件的解读以及常用开发方法的讲解。同时本文档
用词相对简单,主要帮助大家了解 GPU 算子开发需要写什么,各种文件
的作用是什么以及应该怎么写这些文件,而官方文档中则更偏向于基础概
念和框架的介绍,建议大家将两个文档结合起来阅读,这样更能够加深理
解。
② 本文篇幅较长,如果有自己熟悉的内容可以直接跳过,但是建议大家能够
仔细阅读第三章,充分了解 GPU 算子需要开发哪些文件、每个开发文件
的作用以及常用的方法,这样可以更快的入门,开始开发算子。
③ MindSpore GPU 异构算子调用流程如下
④ 此文档也有网页版:https://bbs.huaweicloud.com/blogs/364623,大家愿意
的话可以支持一下,刷一刷阅读量。
⑤ 本文主要为前期准备和开发流程,附加了两个关于接口文档测试的内容,
后续进入测试阶段我也会写一个 GPU 算子测试指导。
⑥ 如有遗漏或错误,欢迎指出与修改。
常用网址
① GPU 算子全流程开发指导录屏
② BartlettWindow 算子 PR
③ MindSpore 算子 Issue 查询网址
④ MindSpore 官方安装网址
⑤ MindSpore 官方算子查询网址
⑥ 谭升-GPU 编程
目录
Tips .............................................................................................................................................................................
常用网址 ...................................................................................................................................................................
一、 环境配置 ..............................................................................................................................................1
1. 连接服务器 ..........................................................................................................................................1
(1)ssh 跳转连接 .................................................................................................................................... 1
(2)VPN 连接方法 ................................................................................................................................. 2
2. 下载 mindspore 包 ...........................................................................................................................5
(1)注册 gitee 账号 ............................................................................................................................... 6
(2)加入 Owner 仓库 ............................................................................................................................ 6
(3)创建分支 ........................................................................................................................................... 7
(4)下载 mindspore .............................................................................................................................. 8
二、 开发流程 ........................................................................................................................................... 10
1. MindSpore GPU 异构算子调用流程 ........................................................................................ 10
2. 开发文件清单 .................................................................................................................................. 10
3. 算子分类介绍 .................................................................................................................................. 12
(1)正向单算子 .................................................................................................................................... 12
(2)正向算子的反向实现 ................................................................................................................. 12
(3)反向单算子 .................................................................................................................................... 12
(4)动态 shape 算子 .......................................................................................................................... 13
(5)支持动态 shape 测试 ................................................................................................................. 13
三、 算子开发 ........................................................................................................................................... 14
1. 算子 Python 侧前端定义 ............................................................................................................. 14
(1)mindspore/python/mindspore/ops/operations/yyy_ops.py ........................................ 14
2. 算子 C++侧前端推理 ................................................................................................................... 15
(1)mindspore/core/ops/xxx.h ....................................................................................................... 15
(2)mindspore/core/ops/xxx.cc ..................................................................................................... 16
(3)mindspore/core/ops/core_ops.h ........................................................................................... 18
(4)mindspore/core/abstract/ops/primitive_infer_map.cc ................................................... 18
3. 算子 C++侧后端适配 ................................................................................................................... 19
(1)mindspore/ccsrc/plugin/device/gpu/kernel/yyy/xxx_gpu_kernel.h .......................... 19
(2)mindspore/ccsrc/plugin/device/gpu/kernel/yyy/xxx_gpu_kernel.cc ......................... 20
4. 算子 cuda 核函数开发.................................................................................................................. 22
(1)mindspore/ccsrc/plugin/device/gpu/kernel/cuda_impl/cuda_ops/xxx_impl.cuh . 22
(2)mindspore/ccsrc/plugin/device/gpu/kernel/cuda_impl/cuda_ops/xxx_impl.cu ... 22
(3)mindspore/ccsrc/plugin/device/gpu/kernel/cuda_impl/cuda_class/xxx_helper.h 23
5. 算子 Python 反向实现文件 ......................................................................................................... 24
(1)mindspore/python/mindspore/ops/_grad_experimental/grad_yyy_ops.py ........... 24
6. 算子 ST 测试文件 ........................................................................................................................... 24
(1)tests/st/ops/gpu/test_xxx_op.py ............................................................................................ 24
四、 如何做 doctest ................................................................................................................................ 25
五、 如何做接口网页自验证 ................................................................................................................ 27
附录 1:BartlettWindow 算子开发详解 ................................................................................................... 30
2
输入 ls,到达此界面即为连接成功!
(2) VPN 连接方法
① 点击右下角网络(WiFi 那个标识),点击网络和 Internet 设置。
② 点击 VPN,添加 VPN(我已经设置过一个,请忽略)。
③ 设置 GPU 算子开发网络连接,输入如下用户名和密码,点击保存。
VPN 信息:
服务器地址:123.60.230.65
用户名:pcvpn
密码:Dg_TuanbowaG6@06-U17
3
④ 打开控制面板-网络连接,并选择刚创建的 vpn 右键属性
⑤ 选择网络-IPV4-属性-高级,取消勾选“在远程网络上使用默认网关”
剩余40页未读,继续阅读
资源评论
花花少年
- 粉丝: 20w+
- 资源: 33
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于matlab实现文档+程序边缘计算任务卸载与资源调度的算法,是论文的源代码,具有价值.rar
- 什么是学生成绩管理系统c++以及学习学生成绩管理系统的意义
- 什么是词向量-以及学习关于了解词向量的意义
- 什么是mybatis动态sql以及学习mybatis动态sql的意义
- 华为数据治理方法论,包括:数据治理框架、数据治理组织架构、数据治理度量评估体系以及华为数据治理案例分享
- 基于matlab实现对表面肌电信号进行归一化处理,并对归一化后的图形显示 .rar
- 基于matlab实现单级倒立摆的 T-S 模型 包括 LMI 程序源码
- 图书管理系统(struts+hibernate+spring+ext).rar
- 基于matlab实现此压缩包包含语音信号处理中的语音变声代码加音频.rar
- STM32使用PWM驱动舵机并通过OLED显示
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功