NVIDIA CUDA
超大规模并行程
NVIDIA CUDA
超大规模并行程
序设计训练课程
序设计训练课程
邓仰东
dengyd@tsinghua edu cn
dengyd@tsinghua
.
edu
.
cn
清华大学微电子学研究所
开设CUDA并行编程课程的大学
肯特州立大学
京都大学
兰德大学
纽约州立大学石溪分校
东京大学
兰德大学
杜克大学
爱尔兰根大学
瑞士联邦理工学院
兰德大学
马里兰大学
麦吉尔大学
麻省理
工
学院
兰德大学
维也纳理工大学
南加州大学
犹他大学
瑞士联邦理工学院
佐治亚理工学院
格洛夫城市学院
哈佛大学
麻省理 学院
北卡罗来纳大学教堂山
分校
伊利诺依理工大学
东北大学
(
美
)
犹他大学
佛吉尼亚大学
伊利诺依理工大学
华盛顿大学
哈佛大学
印度信息技术学院
伊利诺依理工大学
伊利诺依大学香槟分校
东北大学
(
美
国
)
俄勒冈州立大学
宾西法尼亚大学
米兰理工大学
滑铁卢大学
西澳大利亚大学
威廉姆斯学院
法国国家信息与自动化
研究所
爱荷华大学
墨西哥蒙特雷理工学院
米兰理工大学
普度大学
圣塔克拉拉大学
Stanford Stuttgart
威斯康星大学
墨西哥蒙特雷理工学院
约翰霍普金斯大学
2
2
Stanford Stuttgart
日程安排
Day 1: CUDA概论
Day 2:
编程模型
Day 2:
编程模型
Day 3: 多线程和存储器硬件
Da
y
4: 性能提升
3
3
提纲
多核时代
图像处理器计算的发展
图像处理器计算的发展
CUDA的成功应用
CUDA起步
4
4
摩尔定律
Quad-Core Itanium (2G@65n)
Pentium 4
(
42M
@
.18
)
Transistors
(
)
100000000
1000000000
10000000000
Itanium 2
Core 2 Duo
Core 2 Quad
Quad-Core Itanium
4004 (2300@8m)
1000000
10000000
80386
80486
Pentium
Pentium II
Pentium III
Pentium 4
1000
10000
100000
4004
8008
8080
8088
80286
5
5
1971 1972 1974 1979 1982 1985 1989 1993 1997 1999 2000 2003 2005 2006 2006 2008
- 1
- 2
- 3
前往页