ICLRSpotlight｜Facebook提出无损INT8优化器，单机可以跑千亿参数模型了？？.pdf_Flowmatchingforgenerativemodeling资源-CSDN文库

版权申诉

109 浏览量 2023-08-13 09:05:47 上传评论收藏 1.68MB PDF 举报

资源推荐

资源详情

资源评论

2023/6/28 17:05

ICLR Spotlight｜Facebook提出无损INT8优化器，单机可以跑千亿参数模型了？？

https://mp.weixin.qq.com/s/QKSa3anGP4JYPDfn9_coDg

1/8

ICLR Spotlight｜Facebook提出无损INT8优化器，单机可以跑千亿

参数模型了？？

文  | 王思若

2018年GP T 、BERT预训练模型的提出吹响了大模型“ 军备竞赛”冲锋的号角，一场大模型的狂

欢拉开帷幕，业界强大的算力支撑起例如Megatron-Turing、Switch Transformer、悟道2.0等

千亿&万亿参数量模型。与此同时，面对着超大模型训练在内存存储、网络通信、性能功耗等

方面的严峻挑战，这同样是一场工程上极致优化的探索之旅，各家公司纷纷提供了自己的解决

方案或训练框架，常用的方法有以下几种：

1. 并行化方法：主要包括数据并行、模型并行和流水线并行，切分数据、 Tensor 或模型

Block到不同GPU 上从而达到并行化的效果。之后，Google提出了基于专家并行的MoE 架构，

通过稀疏结构拓展实现了大模型万亿参数量的飞跃。

2. 内存 &通信优化方法：进一步为了应对并行化方法在内存及通信量上的局限，16年，陈天

奇团队提出亚线性内存优化的Checkpointing(重计算)方法，在反向传播时重新计算前向传播的

中间激活达到节省显存的目的。 21年，微软提出了 CP U of f load的 ZeRO-Offload方案，将梯

度、优化器、参数在CPU和GPU间Swapping，通过通信成本来大幅度的节省显存开销。当然，

混合精度或者半精度模型训练即采用FP16代替FP32模型参数的量化方法是更加常见有效的方

案，大幅度减少内存带宽和存储空间并且提高系统吞吐量，几乎可以成倍提升模型训练速度。

在这场巅峰较量中， Facebook表示：只需更改两行代码，带你体验极致的显存优化，单

机即可训练千亿模型，助力贫民玩家实现大模型梦！虽然这里单机至少需要 8 张 RTX

王思若 2022-08-30 12:18 发表于北京

原创

夕小瑶科技说

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余7页未读，立即下载

评论收藏

内容反馈

版权申诉

地理探险家

粉丝: 985
资源: 5416

ICLR Spotlight｜Facebook提出无损INT8优化器，单机可以跑千亿参数模型了？？.pdf

最新资源

ICLR Spotlight｜Facebook提出无损INT8优化器，单机可以跑千亿参数模型了？？.pdf

ICLR 2023 最高分论文被锤抄袭？？.pdf

ICLR2020满分论文 - 为什么梯度裁剪能加速模型训练？.pdf

ICLR 2023 最高分论文被锤抄袭？？.rar

ICLR2020满分论文 - 为什么梯度裁剪能加速模型训练？.rar

iclr_2019会议笔记.pdf

ICLR-2019-Poster (8).zip

ICLR-2019-Oral.zip

ICLR’22 最佳脑洞奖提名：《GPT 如何进行布朗运动_》.pdf

ICLR2020---如何判断两个神经网络学到的知识是否一致.pdf

ICLR-2019-Poster (5).zip

斯坦福Jure Leskovec图深度生成模型 - graph_gen-iclr-may19-long.pdf.zip

ICLR 2020 Bengio 一作论文：因果机制、元学习与模型泛化如何产生关联？.zip

ICLR-2019-Poster (9).zip

ICLR2017文献

ICLR 2018.rar

ICLR 2018论文合集

ICLR-2019-Poster (2).zip

iclR基因敲除对大肠杆菌产琥珀酸的影响

相关实用应用程序（Windows可用）

免费可用的ChatGPT网页版.zip

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

2023泛娱乐社交出海手册-ZEGO即构科技

4个亲测好用的ChatGPT4渠道

HAI-2024斯坦福AI指数报告（中文译版）.pdf

学术海报模板+论文科研+研究生

最新资源