没有合适的资源?快使用搜索试试~ 我知道了~
smaller-transformers:加载您需要的东西
共75个文件
json:41个
txt:27个
py:2个
需积分: 9 0 下载量 178 浏览量
2021-05-26
17:28:46
上传
评论
收藏 16.83MB ZIP 举报
温馨提示
较小的多语言变形金刚 该存储库共享较小版本的多语言转换器,这些转换器保留与原始转换器提供的表示相同的表示。 这个想法来自一个简单的观察:经过大量的多语言预训练之后,并不需要所有的嵌入来执行微调和推理。 实际上,很少有人会需要一种模型来支持原始超过100种语言。 因此,我们提取了一些处理较少语言的较小版本。 由于多语言转换器的大多数参数都位于嵌入层中,因此我们的模型的大小要小21%至45%。 下面的表格将我们的两个精简版本与原始mBERT进行了比较。 它在上显示了模型的大小,内存占用以及所获得的准确性(英语为法语的跨语言转换)。 这些测量是在。 模型 数值参数 尺寸 记忆 准确性 伯特基于多语言的情况 1.78亿 714兆字节 1400兆字节 73.8 Geotrend / bert-base-15lang-cased 1.41亿 564兆字节 1098兆字节 74.1 Geotr
资源推荐
资源详情
资源评论
收起资源包目录
smaller-transformers-main.zip (75个子文件)
smaller-transformers-main
.gitignore 2KB
README.md 4KB
reduce_model.py 4KB
LICENSE 11KB
requirements.txt 51B
notebooks
select_mBERT_vocabularies.ipynb 73KB
selected_tokens
selected_uk_tokens.txt 96KB
selected_pl_tokens.txt 138KB
selected_ru_tokens.txt 130KB
selected_fr_tokens.txt 158KB
selected_da_tokens.txt 144KB
selected_nl_tokens.txt 148KB
selected_ro_tokens.txt 131KB
selected_tr_tokens.txt 112KB
selected_vi_tokens.txt 101KB
selected_ur_tokens.txt 53KB
selected_th_tokens.txt 46KB
selected_es_tokens.txt 170KB
selected_en_tokens.txt 187KB
selected_pt_tokens.txt 158KB
selected_it_tokens.txt 162KB
selected_hi_tokens.txt 38KB
selected_lt_tokens.txt 92KB
selected_ja_tokens.txt 48KB
selected_sw_tokens.txt 95KB
selected_el_tokens.txt 70KB
selected_no_tokens.txt 145KB
selected_ar_tokens.txt 48KB
selected_de_tokens.txt 171KB
selected_zh_tokens.txt 57KB
selected_bg_tokens.txt 91KB
generate_cards.py 520B
README_sample.md 1KB
tokens_freqs
english_freqs_lines.json 1.79MB
russe_freqs_lines.json 1.49MB
chinese_freqs_lines.json 1.03MB
ur_freqs_lines.json 554KB
lt_freqs.json 795KB
ur_freqs.json 555KB
ja_freqs.json 1.06MB
el_freqs_lines.json 890KB
el_freqs.json 891KB
vi_freqs_lines.json 1.04MB
it_freqs.json 1.31MB
bg_freqs.json 985KB
spanish_freqs_lines.json 1.39MB
chinese_freqs.json 1.03MB
nl_freqs_lines.json 1.19MB
da_freqs.json 878KB
tr_freqs_lines.json 1013KB
th_freqs.json 654KB
th_freqs_lines.json 653KB
arabic_freqs.json 967KB
pt_freqs.json 1.18MB
sw_freqs_lines.json 482KB
hi_freqs_lines.json 566KB
nl_freqs.json 1.2MB
vi_freqs.json 1.04MB
russe_freqs.json 1.49MB
spanish_freqs.json 1.4MB
ro_freqs.json 1006KB
sw_freqs.json 483KB
french_freqs_lines.json 1.37MB
french_freqs.json 1.38MB
english_freqs.json 1.79MB
arabic_freqs_lines.json 966KB
hi_freqs.json 568KB
uk_freqs.json 1.29MB
no_freqs.json 1.05MB
german_freqs.json 1.36MB
bg_freqs_lines.json 983KB
pl_freqs.json 1.34MB
german_freqs_lines.json 1.36MB
tr_freqs.json 1015KB
vocab_5langs.txt 327KB
共 75 条
- 1
资源评论
歪头羊
- 粉丝: 40
- 资源: 4650
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- JAVAspringboot学生课程查询系统源码数据库 MySQL源码类型 WebForm
- 伯克利大学机器学习-14Optimization methods for learning [John Duchi]
- springboot4d8g9.sql
- (源码)基于SpringBoot和SpringSecurity的系统组织架构管理.zip
- JAVA的Springboot果蔬配送商城源码数据库 MySQL源码类型 WebForm
- (源码)基于C++的简单关系型数据库管理系统.zip
- (源码)基于Python和MMDetection框架的多模态目标检测系统.zip
- LitJson(0.19.0版本,适用于.NetStandard2.0 2.1)
- LitJson(0.19.0版本,适用于.NetStandard1.5)
- (源码)基于ROS的咖啡机器人控制系统.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功