没有合适的资源?快使用搜索试试~ 我知道了~
rc2020_electra:2020年ML再现性挑战
共29个文件
py:20个
yml:2个
png:2个
需积分: 5 0 下载量 85 浏览量
2021-04-01
21:55:40
上传
评论
收藏 547KB ZIP 举报
温馨提示
: 复制 该存储库包含在PyTorch中为所做的重新实现。 此项目是在课程的一部分中进行的。 预处理过程通过命令行进行嵌入和缓存,以进行预训练和下游任务。 通过此还可以提供带有1M步训练的预训练模型。 这项工作利用了HuggingFace库(变压器,数据集,令牌生成器)和PyTorch(1.7.1)。 有关更多信息,请参阅相关的[论文(正在审核)](稍后添加)。 主要结果 我的结果与原始的ELECTRA的实现类似(Clark等人[2020]),尽管与两种实现的原始论文相比都存在细微的差异。 仅14M的参数,ELECTRA就绝对性能而言,胜过某些先前SOTA的并行预训练方法(例如GPT)或使用知识蒸馏的替代有效方法(例如DistilBERT)。 考虑到计算成本,ELECTRA明显优于包括BERT和TinyBERT在内的所有比较方法。 因此,这项工作支持了ELECTRA在计算资源低的情
资源推荐
资源详情
资源评论
收起资源包目录
rc2020_electra-latest_branch.zip (29个子文件)
rc2020_electra-latest_branch
run_glue.py 3KB
.github
workflows
python-package.yml 1KB
models
ByteLevelBPETokenizer-vocab_size=30522-min_frequency=2 1.22MB
run_downstream.py 294B
src
models
train_model_pretraining.py 43KB
train_model_tokenizer.py 4KB
utils.py 2KB
__init__.py 189B
metrics.py 9KB
train_model_downstream.py 16KB
optimizers.py 6KB
modeling_document_electra.py 43KB
features
features_document_electra.py 4KB
__init__.py 136B
data
make_dataset_document_electra.py 12KB
utils.py 5KB
__init__.py 169B
visualization
wandb_callbacks.py 3KB
tensorboard_utils.py 3KB
__init__.py 133B
images
Electra RC2020 - Learning - Original.png 88KB
Electra RC2020 - Learning.png 70KB
run_pretraining.py 293B
requirements.txt 292B
LICENSE 1KB
README.md 7KB
.gitignore 2KB
env.yml 5KB
train_tokenizer.py 275B
共 29 条
- 1
资源评论
钟离舟
- 粉丝: 34
- 资源: 4667
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功