DeepSpeed：DeepSpeed是一个深度学习优化库，可让分布式培训变得轻松，高效，有效

共352个文件

py：135个

png：51个

md：45个

machine-learning

deep-learning

gpu

pytorch

5星 · 超过95%的资源需积分: 50 131 浏览量 2021-02-04 13:14:10 上传评论 1 收藏 15.22MB ZIP 举报

资源详情

资源评论

收起资源包目录

DeepSpeed：DeepSpeed是一个深度学习优化库，可让分布式培训变得轻松，高效，有效（352个子文件）

.clang-format 5KB

CNAME 17B

CODEOWNERS 141B

ds_transformer_cuda.cpp 45KB

cpu_adam.cpp 33KB

utils.cpp 4KB

fused_lamb_cuda.cpp 4KB

fused_adam_frontend.cpp 781B

flatten_unflatten.cpp 742B

csrc 10B

normalize_kernels.cu 75KB

dropout_kernels.cu 30KB

softmax_kernels.cu 23KB

transform_kernels.cu 22KB

fused_lamb_cuda_kernel.cu 15KB

general_kernels.cu 14KB

gelu_kernels.cu 12KB

cublas_wrappers.cu 8KB

multi_tensor_adam.cu 6KB

custom_cuda_kernel.cu 528B

multi_tensor_apply.cuh 5KB

deepspeed 2B

Dockerfile 8KB

ds 105B

ds_elastic 2KB

ds_report 100B

ds_ssh 438B

Gemfile 612B

softmax_animation.gif 3.03MB

layernorm_deepspeed.gif 2.44MB

softmax_deepspeed.gif 2.3MB

layernorm_pytorch.gif 1.75MB

layernorm_animation.gif 1.35MB

softmax_pytorch.gif 1.29MB

.gitignore 372B

.gitmodules 129B

custom_cuda_layers.h 10KB

gemm_test.h 9KB

normalize_layer.h 7KB

context.h 7KB

strided_batch_gemm.h 6KB

ds_transformer_cuda.h 6KB

type_shim.h 5KB

cpu_adam.h 5KB

feed_forward.h 3KB

cublas_wrappers.h 3KB

dropout.h 2KB

StopWatch.h 2KB

softmax.h 2KB

general_kernels.h 1KB

Timer.h 1KB

gelu.h 955B

compat.h 287B

news-home.html 504B

404.html 419B

index.html 26B

MANIFEST.in 174B

ds_config_func_bs8_zero2_offload.json 537B

ds_config_func_bs8_zero0_gas3.json 526B

ds_config_func_bs8_zero2_gas3.json 526B

ds_config_func_bs8_zero2.json 512B

ds_config_func_scheduler.json 449B

ds_config_func_bs4_zero2_offload.json 422B

ds_config_func_bs4_zero2.json 397B

deepspeed_bsz24_fp16_config.json 344B

deepspeed_bsz24_fp16_zero2_config.json 344B

ds_config_perf_bs16.json 326B

ds_config_perf_bs32.json 326B

ds_config_perf_bs8.json 325B

deepspeed_bsz24_fp32_config.json 298B

ds_config_func_bs4_zero1.json 296B

ds_config_func_bs8_no_zero.json 296B

ds_config_func_bs8_zero1.json 296B

ds_batch_config.json 277B

azure_config.json 146B

LICENSE 1KB

Gemfile.lock 8KB

Makefile 638B

config-json.md 21KB

sparse-attention.md 18KB

index.md 17KB

2020-05-28-fastest-bert-training.md 17KB

megatron.md 17KB

bert-pretraining.md 16KB

bert-finetuning.md 16KB

README.md 14KB

2020-09-09-onebit-adam-blog-post.md 13KB

onebit-adam.md 13KB

features.md 12KB

pipeline.md 12KB

cifar-10.md 12KB

README.md 12KB

getting-started.md 10KB

2020-09-09-sparse-attention.md 9KB

transformer_kernel.md 9KB

progressive_layer_dropping.md 8KB

zero.md 7KB

lrrt.md 7KB

1Cycle.md 6KB

azure.md 6KB

共 352 条

评论收藏

内容反馈

BJWcn

2023-06-20

对于新手来说，这个优化库可以帮助他们更好地理解深度学习。

DeepSpeed：DeepSpeed是一个深度学习优化库，可让分布式培训变得轻松，高效，有效

评论10

最新资源

DeepSpeed：DeepSpeed是一个深度学习优化库，可让分布式培训变得轻松，高效，有效

评论10

最新资源

相关推荐

Python库 | deepspeed-0.3.1.dev6.tar.gz

DeepSpeed是一个深度学习优化库，可让分布式培训变得轻松，高效和有效。-Python开发

windows版deepspeed深度学习库

DeepSpeedExamples:使用 DeepSpeed 的示例模型

deepspeed-0.8.3+4d27225f-cp39-cp39-win_amd64.whl

深度学习库:DeepSpeed

deepspeed-0.8.3+6eca037c-cp310-cp310-win-amd64.whl.zip

gpt-neox:基于DeepSpeed库的GPU上类似于GPT-3的模型并行模型的实现。 设计成能够训练数千亿甚至更大参数的模型

DeepSpeed是一个深度学习优化库，使分布式训练和推理变得简单、高效和有效

Python_DeepSpeed是一个深度学习优化库，它使分布式训练和推理变得简单、高效和有效.zip

Maximizing+Parallelism+in+Distributed+Training

speeder.exe局域网可加速

parallelism:Go、Node 和 Scala 中的并行批处理

Qt 5实现串口调试助手 （源工程文件、0积分下载）

【SystemVerilog】路科验证V2学习笔记（全600页）.pdf

AutoSAR标准协议4.2.2

光伏-储能并网系统仿真.rar

XCP协议的规范文档

GD32替换STM32注意事项.pdf

NPPJSONViewer.zip

蓝牙BLE协议中文版.pdf

CANoe通过CAPL脚本实现自动测试

电路分析基础第二版PDF电子书免费下载

qt样式表一键生成（花狗Fdog）

Tangent免费.rar

CMSIS-DAP使用说明及驱动.rar

VS2015安装证书，JavaScript_ProjectSystem.msi，JavaScript_LanguageService.msi

BaiduOCR.zip

Elsevier期刊word模板.zip

gpt-neox:基于DeepSpeed库的GPU上类似于GPT-3的模型并行模型的实现。设计成能够训练数千亿甚至更大参数的模型

Qt 5实现串口调试助手（源工程文件、0积分下载）