没有合适的资源?快使用搜索试试~ 我知道了~
DeepSpeedExamples:使用 DeepSpeed 的示例模型
共1685个文件
py:1174个
sh:131个
rst:86个
5星 · 超过95%的资源 需积分: 41 8 下载量 85 浏览量
2021-08-04
23:16:42
上传
评论
收藏 9.57MB ZIP 举报
温馨提示
深速 此存储库包含使用示例模型。 关于威震天示例的说明 Megatron-LM :这是 Megatron-LM 的一个相当古老的快照,我们一直在使用它来展示 DeepSpeed 的早期功能。 这不包含 ZeRO-3 或 3D 并行性。 Megatron-LM-v1.1.5-3D_parallelism:这是一个相对较新的 Megatron(2020 年 10 月),但在 Megatron 开始支持 3D 并行之前。 我们移植了这个版本来展示如何在 DeepSpeed 中使用 Megatron 中的 3D 并行性。 Megatron-LM-v1.1.5-ZeRO3:Megatron 底层版本与 3D_parallelism 相同,但不包含 3D 并行端口。 然而,它包含 DeepSpeed 的最新进展,包括 ZeRO-3、ZeRO-3 Offload 和 ZeRO-Infinity。 我
资源推荐
资源详情
资源评论
收起资源包目录
DeepSpeedExamples:使用 DeepSpeed 的示例模型 (1685个子文件)
setup.cfg 788B
CODEOWNERS 141B
helpers.cpp 27KB
helpers.cpp 24KB
helpers.cpp 24KB
layer_norm_cuda.cpp 5KB
scaled_masked_softmax.cpp 3KB
scaled_upper_triang_masked_softmax.cpp 2KB
scaled_masked_softmax.cpp 2KB
scaled_masked_softmax.cpp 2KB
scaled_upper_triang_masked_softmax.cpp 2KB
scaled_upper_triang_masked_softmax.cpp 2KB
huggingface.css 7KB
code-snippets.css 297B
my_knowledge_dataset.csv 4KB
layer_norm_cuda_kernel.cu 25KB
scaled_masked_softmax_cuda.cu 4KB
scaled_masked_softmax_cuda.cu 3KB
scaled_masked_softmax_cuda.cu 3KB
scaled_upper_triang_masked_softmax_cuda.cu 3KB
scaled_upper_triang_masked_softmax_cuda.cu 3KB
scaled_upper_triang_masked_softmax_cuda.cu 3KB
Dockerfile 3KB
Dockerfile 846B
Dockerfile 825B
Dockerfile 778B
Dockerfile 640B
Dockerfile 629B
Dockerfile 613B
Dockerfile 608B
ppl_full.gif 418KB
ppl_sliding.gif 373KB
ppl_chunked.gif 352KB
.gitignore 2KB
.gitignore 50B
.gitmodules 147B
scaled_upper_triang_masked_softmax.h 23KB
scaled_masked_softmax.h 21KB
scaled_masked_softmax.h 19KB
scaled_masked_softmax.h 19KB
scaled_upper_triang_masked_softmax.h 19KB
scaled_upper_triang_masked_softmax.h 19KB
type_shim.h 2KB
compat.h 895B
favicon.ico 47KB
MANIFEST.in 65B
MANIFEST.in 65B
MANIFEST.in 65B
MANIFEST.in 16B
05-benchmark.ipynb 445KB
03-pipelines.ipynb 118KB
04-onnx-export.ipynb 110KB
demo.ipynb 87KB
02-transformers.ipynb 39KB
Saving_PruneBERT.ipynb 28KB
01-training-tokenizers.ipynb 14KB
custom.js 23KB
test.json 27KB
val.json 21KB
sample.json 17KB
sample.json 15KB
train.json 11KB
fsmt_val_data.json 9KB
onnx.json 6KB
sample.json 3KB
sample.json 3KB
bert_large_lamb.json 2KB
bert_large.json 2KB
bert_base.json 2KB
bert_large_lamb_nvidia_data.json 2KB
bert_base_large_lr.json 1KB
sample.json 1KB
ds_zero_stage_infinity_config.json 1KB
ds_config.json 952B
ds_zero_stage_3_config_release.json 756B
deepspeed_bsz64k_lamb_config_seq128.json 718B
ds_zero-offload_10B_config.json 707B
ds_zero_stage_2_config.json 677B
ds_zero_stage_2_config.json 677B
deepspeed_bsz64k_onebitlamb_config_seq128_nccl.json 674B
deepspeed_bsz64k_onebitlamb_config_seq128_mpi_ethernet.json 673B
deepspeed_bsz64k_onebitlamb_config_seq128_mpi_infiniband.json 672B
ds_zero-offload_config.json 665B
deepspeed_bsz32k_onebitlamb_config_seq512_nccl.json 642B
deepspeed_bsz32k_onebitlamb_config_seq512_mpi_ethernet.json 641B
deepspeed_bsz32k_onebitlamb_config_seq512_mpi_infiniband.json 640B
ds_zero2_config.json 599B
ds_zero_stage_3_config.json 599B
configuration.json 546B
test.json 532B
deepspeed_bsz4k_onebitadam_config_seq128_nccl.json 517B
deepspeed_bsz4k_onebitadam_config_seq128_mpi_ethernet.json 516B
deepspeed_bsz4k_onebitadam_config_seq128_mpi_infiniband.json 515B
deepspeed_bsz4k_progressive_layer_drop_config_seq128.json 515B
cookiecutter.json 461B
deepspeed_bsz32k_lamb_config_seq512.json 441B
bert-large-uncased-whole-word-masking-config.json 434B
ds_config.json 425B
deepspeed_onebitadam_bsz96_config.json 393B
deepspeed_onebitadam_bsz96_config.json 392B
共 1685 条
- 1
- 2
- 3
- 4
- 5
- 6
- 17
资源评论
- 蟹蛛2023-07-25文档中介绍的DeepSpeed示例模型给予了我信心,让我相信我能够更好地利用这个工具来提升我的深度学习项目。
- 王佛伟2023-07-25这个文件提供了一些非常实用的DeepSpeed示例模型,对学习和使用DeepSpeed非常有帮助。
- 今年也要加油呀2023-07-25DeepSpeed示例模型的代码实现简洁清晰,让人很容易理解和上手,真的没想到加速训练过程可以这么简单。
- 空城大大叔2023-07-25配合DeepSpeed示例模型,我感受到了提升训练速度和减少资源消耗的好处,效果相当不错。
- 销号le2023-07-25无论是小规模还是大规模的深度学习任务,DeepSpeed示例模型都能够提供高效且稳定的性能,真的很满意。
BinaryBrewmaster
- 粉丝: 16
- 资源: 4598
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- pta题库答案c语言之树结构2ListLeaves.zip
- pta题库答案c语言之树结构1树的同构.zip
- 基于C++实现民航飞行与地图简易管理系统可执行程序+说明+详细注释.zip
- pta题库答案c语言之复杂度1最大子列和问题.zip
- 三维装箱问题(Three-Dimensional Bin Packing Problem,3D-BPP)是一个经典的组合优化问题
- 以下是一些关于Linux线程同步的基本概念和方法.txt
- 以下是一个简化的示例,它使用pygame库来模拟烟花动画的框架.txt
- Linux线程同步机制深度解析与实用指南.zip
- PTA题库C语言解题策略与实战.rar
- SVPWM控制技术的simulink建模与仿真【包括simulink模型,参考文献,操作步骤】
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功