Atlas2.2.0编译、安装及使用(集成ElasticSearch，导入Hive数据).doc

版权申诉

技术资料

103 浏览量 2022-07-12 11:32:52 上传评论收藏 747KB DOC 举报

资源详情

资源评论

Bert 不完全手册 5. BERT 推理提速？训练提速!内存压缩！Albert

Albert 是 A Lite Bert 的缩写，通过词向量矩阵分解，以及 transformer block 的参

数共享，大大降低了 Bert 的参数量级。在我读 Albert 论文之前，因为 Albert 和蒸馏，剪枝

一起被归在模型压缩方案，导致我一直以为 Albert 也是为了优化 Bert 的推理速度，但其实

Albert 主要用在模型参数（内存）压缩，以及训练速度优化，在推理速度上并没有提升。正

在施工中的文本分类库里也加入了 Albert 预训练模型，有在 chinanews 上已经微调好可以开

箱即用的模型，同时支持半监督，领域迁移，降噪 loss，蒸馏等模型优化项，感兴趣戳这里

SimpleClassification

Albert 是 A Lite Bert 的缩写，确实 Albert 通过词向量矩阵分解，以及 transformer block 的

参数共享，大大降低了 Bert 的参数量级。在我读 Albert 论文之前，因为 Albert 和蒸馏，剪

枝一起被归在模型压缩方案，导致我一直以为 Albert 也是为了优化 Bert 的推理速度，但其

实 Albert 更多用在模型参数（内存）压缩，以及训练速度优化，在推理速度上并没有提升。

如果说蒸馏任务是把 Bert 变矮瘦，那 Albert 就是把 Bert 变得矮胖。正在施工中的文本分类

库里也加入了 Albert 预训练模型，有在 chinanews 上已经微调好可以开箱即用的模型，同时

支持半监督，领域迁移，降噪 loss，蒸馏等模型优化项，感兴趣戳这里 SimpleClassification

Albert 主要有以下三点创新

参数共享：降低 Transfromer Block 的整体参数量级

词向量分解：有效降低词向量层参数量级

Sentence-Order-Prediction 任务：比 NSP 更加有效的学习句间关系

下面我们分别介绍这三个部分

词向量分解

其实与其说是分解，个人觉得词向量重映射的叫法更合适一些。在之前 BERT 等预训练

模型中，词向量的维度 E 和之后隐藏层的维度 H 是相同的，因为在 Self-Attention 的过程中

Embedding 维度是一直保持不变的，所以要增加隐藏层维度，词向量维度也需要变大。但是

从包含的信息量来看，词向量本身只包含上下文无关的信息，并不需要像隐藏层一样存储大

量的上下文语义，所以相同维度的限制在词向量部分存在一定的参数冗余。所以笔者对词向

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余3页未读，立即下载

评论收藏

内容反馈

版权申诉

Atlas2.2.0编译、安装及使用(集成ElasticSearch，导入Hive数据).doc

评论0

最新资源

Atlas2.2.0编译、安装及使用(集成ElasticSearch，导入Hive数据).doc

评论0

最新资源

相关推荐

apache-atlas-2.1.0源码编译包

Apache Atlas 2.2.0 编译版本，开箱即用

apache-atlas-2.2.0-hook.tar

apache-atlas-2.2.0-hive-hook.tar.gz

apache-atlas-2.2.0-falcon-hook.tar.gz

atlas 2.2.0源码包，apache-atlas-2.2.0-sources.tar.gz

大数据技术之CM6.3.1+CDH6.3.2 集成 Atlas2.2.0.pdf

Hadoop 2.2.0编译安装详解

apache-hive-2.2.0-bin.tar.gz

hadoop-2.2.0编译安装

apache-atlas-2.2.0-server.tar.gz

元数据管理工具 atlas 最新版本2.2 编译版本

spire.doc.free-2.0.0.jar

apache-hive-2.2.0-src.tar.gz

elasticsearch-2.2.0集成ik

apache-atlas-2.2.0-sqoop-hook.tar.gz

apache-atlas-2.2.0-hbase-hook.tar.gz

apache atlas-2.2.0

Java第十五届蓝桥杯大赛软件JavaB组真题

SwitchHosts

安卓期末大作业（AndroidStudio开发），垃圾分类助手app，分为前台后台，代码有注释，均能正常运行

Notepad++安装包

2024北森能力测评题库.7z

微信小程序源码-合集1.rar

Java面试八股文2023最新版

Linux Centos7 升级最新版OpenSSH-9.6p1 有脚本（支持离线）

JDK1.8 windows 64位

ruoyi-vue-pro 芋道源码项目的表结构