没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
DeepSpeed是一个深度学习优化库,可让分布式培训变得轻松,高效和有效。 10倍大的模型5倍更快的训练最小的代码更改DeepSpeed可以训练具有超过一千亿参数的DL模型DeepSpeed是一个深度学习优化库,使分布式训练变得容易,高效和有效。 10倍大的模型10倍更快的训练最小的代码更改DeepSpeed可以在当前一代的GPU集群上训练具有超过千亿个参数的深度学习模型,而与现有技术相比,其系统性能可以提高10倍以上。 DeepSpeed的早期采用者已经产生了一种语言模型(LM),该模型具有超过17B个参数,称为Turing-NLG,从而建立了一个
资源推荐
资源详情
资源评论
收起资源包目录
DeepSpeed是一个深度学习优化库,可让分布式培训变得轻松,高效和有效。-Python开发 (474个子文件)
setup.cfg 111B
.clang-format 5KB
CNAME 17B
CODEOWNERS 141B
ds_transformer_cuda.cpp 46KB
cpu_adam.cpp 33KB
pt_binding.cpp 25KB
deepspeed_aio_common.cpp 13KB
deepspeed_py_aio_handle.cpp 10KB
deepspeed_py_copy.cpp 4KB
utils.cpp 4KB
deepspeed_py_aio.cpp 4KB
deepspeed_aio_utils.cpp 4KB
fused_lamb_cuda.cpp 4KB
deepspeed_aio_thread.cpp 3KB
pt_binding.cpp 2KB
deepspeed_aio_types.cpp 2KB
py_ds_aio.cpp 2KB
fused_adam_frontend.cpp 781B
flatten_unflatten.cpp 742B
csrc 10B
normalize_kernels.cu 75KB
quantizer.cu 36KB
dropout_kernels.cu 30KB
transform_kernels.cu 23KB
softmax_kernels.cu 23KB
normalize.cu 15KB
softmax.cu 15KB
fused_lamb_cuda_kernel.cu 15KB
general_kernels.cu 14KB
gelu_kernels.cu 12KB
gelu.cu 9KB
cublas_wrappers.cu 8KB
multi_tensor_adam.cu 6KB
dequantize.cu 4KB
custom_cuda_kernel.cu 528B
multi_tensor_apply.cuh 5KB
deepspeed 2B
Dockerfile 8KB
ds 105B
ds_elastic 2KB
ds_report 100B
ds_ssh 438B
Gemfile 612B
softmax_animation.gif 3.03MB
layernorm_deepspeed.gif 2.44MB
softmax_deepspeed.gif 2.3MB
layernorm_pytorch.gif 1.75MB
layernorm_animation.gif 1.35MB
softmax_pytorch.gif 1.29MB
.gitignore 372B
.gitmodules 129B
custom_cuda_layers.h 11KB
gemm_test.h 9KB
cublas_wrappers.h 9KB
normalize_layer.h 7KB
context.h 7KB
strided_batch_gemm.h 6KB
ds_transformer_cuda.h 6KB
type_shim.h 5KB
cpu_adam.h 5KB
context.h 4KB
feed_forward.h 3KB
custom_cuda_layers.h 3KB
cublas_wrappers.h 3KB
deepspeed_py_aio_handle.h 2KB
dropout.h 2KB
deepspeed_aio_utils.h 2KB
StopWatch.h 2KB
softmax.h 2KB
deepspeed_aio_thread.h 1KB
deepspeed_aio_types.h 1KB
deepspeed_aio_common.h 1KB
general_kernels.h 1KB
deepspeed_py_copy.h 1KB
Timer.h 1KB
deepspeed_py_aio.h 981B
gelu.h 955B
compat.h 287B
quantizer.h 165B
news-home.html 504B
404.html 419B
index.html 26B
MANIFEST.in 174B
gpt2-vocab.json 1018KB
deepspeed_bsz24_fp16_eigenvalue_quantize_config.json 1KB
ds_config_func_bs8_zero2_offload.json 537B
ds_config_func_bs8_zero0_gas3.json 526B
ds_config_func_bs8_zero2_gas3.json 526B
ds_config_func_bs8_zero2.json 512B
ds_config_func_scheduler.json 449B
ds_config_func_bs4_zero2_offload.json 422B
ds_config_func_bs4_zero2.json 397B
single_process_config.json 359B
deepspeed_bsz24_fp16_config.json 344B
deepspeed_bsz24_fp16_zero2_config.json 344B
ds_config_perf_bs16.json 326B
ds_config_perf_bs32.json 326B
ds_config_perf_bs8.json 325B
deepspeed_bsz24_fp32_config.json 298B
共 474 条
- 1
- 2
- 3
- 4
- 5
资源评论
靚兔
- 粉丝: 34
- 资源: 4637
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 农村小别墅图纸编号D040-三层-08.30&14.60米-施工图.dwg
- 三层别墅图纸编号D039-三层-16.70&14.70米- 结构图.dwg
- 三层农村小别墅编号D038-三层-11.90&13.50米-施工图.dwg
- 采购组·主管业务原型集与说明(Xmind书写)
- 三层图纸编号D037-三层-10.40&15.10米-施工图.dwg
- 三层别墅图纸编号D036-三层-14.04&15.44米-施工图.dwg
- 三层别墅图纸编号D035-三层-09.30&13.80米- 施工图.dwg
- 三层别墅图纸编号D032-三层-07.20&10.00米- 施工图.dwg
- 三层别墅图纸编号D031-三层-08.00&09.70米- 施工图.dwg
- aaaaaaaaaaa
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功