AMDOpenCL大学课程(6)

所需积分/C币:5 2021-03-03 20:26:19 522KB PDF
7
收藏 收藏
举报

本节主要讲述GPU的memory架构。优化基于GPUdevice的kernel程序时,我们需要了解很多GPU的memory知识,比如内存合并,bankconflit(冲突)等等,这样才能针对具体算法做一些优化工作。假定X是一个指向整数(32位整数)数组的指针,数组的首地址为0x00001232。一个线程要访问元素X[0],inttmp=X[0];假定memory总线宽度为256位(HD5870就是如此,即为32字节),因为基于字节地址的总线要访问memeory,必须和总线宽度对齐,也就是说按必须32字节对齐来访问memory,比如访问0x00000000,0x00000020,0x000000

...展开详情
试读 7P AMDOpenCL大学课程(6)
立即下载 低至0.43元/次 身份认证VIP会员低至7折
一个资源只可评论一次,评论内容不能少于5个字
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
上传资源赚钱or赚积分
最新推荐
AMDOpenCL大学课程(6) 5积分/C币 立即下载
1/7
AMDOpenCL大学课程(6)第1页
AMDOpenCL大学课程(6)第2页

试读结束, 可继续读1页

5积分/C币 立即下载 >