没有合适的资源?快使用搜索试试~ 我知道了~
变形金刚模型并行:在变压器中实现的T5和GPT2的模型并行性
需积分: 48 1 下载量 130 浏览量
2021-02-18
11:48:27
上传
评论
收藏 6.4MB ZIP 举报
温馨提示
适用于GPT2和T5的具有模型并行性的变压器 这是主变压器库上的一个分支,使您可以在多个设备上分配gpt2-xl , t5-3b和t5-11b等超大型模型的关注块,从而使您可以微调大型变压器。 在HuggingFace团队能够将我的更改合并到主库中之前,我将保留此存储库。 通常,大型变压器的性能要比其较小的同类产品好得多。 模型并行性由模型上的两种方法控制,如下所示: from transformers import GPT2LMHead model = GPT2LMHead('gpt2-xl') device_map = {0: [0, 1, 2, 3, 4, 5, 6, 7, 8], 1: [9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21], 2: [22, 23, 24, 2
资源推荐
资源评论
资源评论
weixin_42166626
- 粉丝: 20
- 资源: 4530
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功