下载  >  开发技术  >  其它  > 风辰的CUDA培训教程

风辰的CUDA培训教程 评分

本无意于发布这个文档,但是最近还有很多人说能够从我四年前发布的《风辰的CUDA入门教程》 中学习。对我当时一不小心发布的内容造成误人子弟非常内疚。另外,那个资料已经非常过时了,而且很多内容是不成熟的观点。拜托大家不要再看了。——by 风辰
内容提要 CUDA基础 CUDA程序优化 o OpenACC简介 2013/8/6 Tuesday 风辰 CUDA基础 o CPU VS GPU O CUDA O CUDA程序在硬件上的执行 ⊙分支优化 CUDA计算能力 ◎共享存储器 2013/8/6 Tuesday 风辰 GP∪计算能力和带宽远肼CP∪ Thearetical Theoretical GB/s GFLOP/S 1500 GeforceGTX 480 GeForceGIr4uo 180 iNIDIA GPU Single Precision PNDA CPU Double precision GaForteutx785 1250 160 Intel cpu single precision GPU Intel cpu double precision GefotteGTx 280 120 GeForce BDo GTX 80 GeForce Bl0 GTx Tesla C2050 Geforce 7800 GIX 60 Westmore 40 geForce 6800GT Geforce /800GIX Bloomfield 250 Westmere Woodcrest GeForee6800 uitra Tesla C1060/Bloomfield 20 eForceFX 590 Prescott GefForceFX 5800 Woodcrest Harpertown Northwood Pentium4 Harpertown 0-01, 03 Jun 04 act 05 Mar 07 lul 0B Dec-09 200320042002002007200820901 GP∪Vs.CPU o CPU 追求单线程的最高性能,对延迟敏感,指令级并行 大量的晶体管用于缓存而非计算单元,而缓存并不 提供原生/峰值计算能力 由于散热、晶体管尺寸等影响,近年来,频率提升 接近停止 。分支预测和超线程性能提升小,但消耗晶体管多 SSE和AVX指令能够很好的提升性能,但难以使用 多核技术易于使用,但是集成核心数量有限 2013/8/6 Tuesday 风辰 GP∪Vs.CPU O GPU 原生计算能力百倍于主流CPU的高性能处理器 。硬件多线程、高存储器带宽、高延迟 。对存储器带宽的要求高于延迟 。通过并发访存及线程切换掩盖存储器访间延迟 Control ALUALU ALU ALU Cache DRAM DRAM CPU GPU 2013/8/6 Tuesday 风辰 早期的 GPGPU ◎思想 计首计程尴圳成岿氿讨程 不足 不能充分的利用硬件资源 。存储器访问方式严重受限,无法乱序访问 难以调试和查错 需要专家级的图形学知识,很少有人能够使用 2013/8/6 Tuesday 风辰 异构计算 eCPU+GPU应用程序 GPU使用C∪DA、 OpenCL等,CPU使用C/C++等 CPU顺序执行、控制GPU、多核及SSE/AX技术 GPU执行数据并行代码 ⊙融合( Fusion) AMD APU 注意 CPU中融入GPU 有其立的 ° NVIDIA Denver 存器和指令执 GPU中融入Arm 行单元 2013/8/6 Tuesday 风辰 基于GP∪的开发环境 ⊙ AMD AP 支持 AMD GPU、CPU和APU 支持 OpenCL O NVIDIA CUDA 支持 NVIDIA GPU 支持 CUDA C和 OpenCL 相比○ penCE和 Brook+,C∪DA更易于使用 NⅥDIA对CUDA的大力支持 ◎计算效率高,加速十几,几十倍很常见 2013/8/6 Tuesday 风辰

...展开详情
所需积分/C币:11 上传时间:2017-03-13 资源大小:4.7MB
举报 举报 收藏 收藏
分享 分享
清华大学CUDA编程教程

清华大学CUDA编程教程, 初学者的极品入门教程,作为入门资源很难得.

立即下载
清华大学CUDA培训课程

清华大学CUDA培训课程 可以当做是CUDA的一个入门介绍。

立即下载
风辰的CUDA入门教程

比较早的资料了,易懂,可以参考一下,风辰的CUDA入门教程

立即下载
风辰的CUDA培训教材

风辰的CUDA培训教材

立即下载
风辰的CUDA培训教程

本无意于发布这个文档,但是最近还有很多人说能够从我四年前发布的《风辰的CUDA入门教程》 中学习。对我当时一不小心发布的内容造成误人子弟非常内疚。另外,那个资料已经非常过时了,而且很多内容是不成熟的观点。拜托大家不要再看了。——by 风辰

立即下载
风辰翻译Cuda3.0 Programming Guide

CUDA技术大牛 风辰亲力翻译的CUDA编程规则 ,很好很强大

立即下载
Oxford CUDA培训

牛津大学的关于CUDA的培训教程,有助于CUDA的入门 包涵9个lecture和两个优化的教程 CUDACourseOxford_Analysis_Driven_Optimization CUDACourseOxford_Optimization_Knowledge

立即下载
NVIDIA台湾CUDA培训课程

NVIDIA在台湾讲授的CUDA培训课程讲义,PPT格式,共9个章节。因为是直接出自NVIDIA的资料,权威性与准确性自不必说,同时其内容对CUDA知识点的涵盖上那也是相当完整的。

立即下载
cuda4.0编程指南,风辰大大译

很经典啊,本人初学,是学习gpu编程的神作

立即下载
清华大学微电子研究所CUDA培训教程

清华大学微电子研究所CUDA培训教程,是当时参加清华CUDA培训时使用的资料,由清华教授邓仰东授课。pdf格式,共4节内容。

立即下载
清华大学CUDA培训教程(邓仰东 ppt)

邓仰东老师讲课的PPT,是CUDA学习者的必修课!当然你可能没有机会或是没有时间去亲自聆听课程。但看了PPT自学也会令你受益良多 让我们共同学习

立即下载
cuda 教程 cuda tutorial

for cuda beginner, using c for cuda.

立即下载
CUDA参考手册 CUDA

CUDA参考手册,目录是英文的内容是中文的

立即下载
MartrixAdd_CUDA 矩阵加的CUDA实现

入门练习的小程序,呵呵,CUDA实现矩阵加法。

立即下载
BFS_CUDA 广搜的CUDA实现

BFS_CUDA源码,图用邻接链表表示,一层结点并行起来,一结点一线程,复杂度是O(diameter)。具体原理请参见blog.csdn.net/iJuliet

立即下载