Dojo 性能强劲,AI 应用场景拓展
[Table_Industry]
电子
[Table_ReportDate]
2023 年 09 月 22 日
请阅读最后一页免责声明及信息披露 http://www.cindasc.com 2
证券研究报告
行业研究
[Table_ReportType]
行业专题研究
[Table_StockAndRank]
电子
投资评级
看好
上次评级
看好
[Table_Author]
莫文宇 电子行业首席分析师
执业编号:S1500522090001
联系电话:13437172818
邮 箱:mowenyu@cindasc.com
韩字杰 联系人
邮 箱:hanzijie@cindasc.com
信达证券股份有限公司
CINDA SECURITIES CO.,LTD
北京市西城区闹市口大街9号院 1号楼
邮编:100031
[Table_Title]
Dojo 完善 AI 闭环,持续看好硬件潜力
[Table_ReportDate]
2023 年 09 月 22 日
本期内容提要:
➢ D1 芯片对标英伟达 A100,ExaPOD 算力可达 1.1EFLOPS。特斯拉 D1
芯片采用台积电 7nm 制程,面积约为 645mm²,包含 500 亿颗晶体管,
BF16/CFP8 算力可达 362TFLOPS,FP32 算力可达 22.6TFLOPS。25 个
D1 芯片组成了一个 Training Tile 多晶片模组(MCM), 6 个 Training Tile
组成一个 tray,再由两个 Tray 组成一个机柜,10 个机柜组成 ExaPOD,
BF16/CFP8 峰值算力达到 1.1EFLOPS(百亿亿次浮点运算),并拥有
1.3TB 高速 SRAM 和 13TB 高带宽 DRAM。
➢ D1 芯片需要高速的互联支撑,台积电 SoW 封装技术提供土壤。在单个
Training tile 上,由于并未将芯片切下,为了提高效率和降低成本,特斯拉
未在片上集成 DRAM 等器件,这与许多通用 GPU 有所不同。集群节点之
间以 2D mesh 连接,边缘则通过 Interface-processors 负责内存池数据搬
运,因此高速互联是必要的,台积电 SoW 封装技术提供了土壤。
InFO_SoW 取消了衬底和 PCB 的使用,使得多个芯片阵列使解决方案获
得晶圆级优势,以获得低延时、高带宽等优势。此外除了异构芯片集成外,
还支持基于小芯片的设计,以实现更大的成本节约和设计灵活性。在部分
模型上,Dojo 能实现相对 A100 更高的性能。例如在图像分类模型 ResNet-
50 上,Dojo 可以实现比英伟达 A100 更高的帧率。而在用于预测汽车周
围物体所占空间的神经网络模型 Occupancy Networks 上,相比英伟达
A100,Dojo 能实现性能的倍增。
➢ 特斯拉将大力投资基础设施,2024 年有望达 100Exa-Flops 算力。特斯
拉目前 AI 基础设施较少,仅约 4000 个 V100 和约 16000 个 A100。而
Microsoft 和 Meta 等公司拥有超过 10 万个 GPU。据特斯拉规划,2024
年有望达 100Exa-Flops 算力。特斯拉拥有自身车型收集的海量数据,但
受限于硬件限制无法充分挖掘数据价值。我们认为,大力投资 AI 基础硬
件设施之后,除加速自身智驾进程外,或可拓展至其他商用领域,如智能
机器人等;此外,特斯拉未来也可能成为一家云服务提供商,向相关厂商
提供自身算力或模型服务。
➢ 投资建议:第一,看好服务器定制化趋势。从特斯拉 Dojo 上我们看到 AI
在专业领域的价值,而相似案例有望在教育、医疗、办公等场景拓展,服
务器定制化趋势或蔚然成风。建议关注算力产业链:工业富联/沪电股份。
第二,受益 AI 强势赋能,特斯拉产业链或迎成长良机。基础硬件限制解
决,AI 大模型性能提升,在特斯拉体系内形成良性循环,特斯拉智能驾驶、
机器人、零部件等相关厂商或持续受益,建议关注:东山精密/领益智造/
舜宇光学/世运电路/胜宏科技等。
➢ 风险因素:宏观经济下行风险;AI 发展不及预期风险;短期股价波动风险。
请阅读最后一页免责声明及信息披露 http://www.cindasc.com 3
目 录
Dojo 性能强劲,AI 应用场景拓展 ..................................................................................................... 4
风险因素 .............................................................................................................................................. 7
图 目 录
图 1:D1 芯片 ...............................................................................................................................................................4
图 2:Training Tile 结构 ............................................................................................................................................4
图 3:6 个 Training Tile 组成一个 tray .................................................................................................................5
图 4:2 个 Tray 组成一个 Cabinet .........................................................................................................................5
图 5: Training Tile 互联 ..........................................................................................................................................5
图 6:2D mesh 互联 ...................................................................................................................................................5
图 7:InFO_SoW 封装 ................................................................................................................................................5
图 8: ResNet-50 上 Dojo 实现比英伟达 A100 更高的帧率 .....................................................................6
图 9:Occupancy Networks 上 Dojo 能实现性能的倍增。 .........................................................................6
图 10:特斯拉算力规划 ............................................................................................................................................6
图 11:Model3 硬件配置 ........................................................................................................................................7