谷歌：一篇论文，让研究者吃我三份安利.rar资源-CSDN文库

共1个文件

pdf：1个

版权申诉

NLP

深度学习

120 浏览量 2023-10-18 18:05:29 上传评论收藏 3.78MB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

谷歌：一篇论文，让研究者吃我三份安利.rar （1个子文件）

谷歌：一篇论文，让研究者吃我三份安利.pdf 5.24MB

⾕

歌

：⼀

篇

论

⽂

，

让

研

究

者

吃

我

三

份

安

利

⽂

⽩

鹡鸰

想

⽤

Transformer

做

编

⼩

轶

想

⽤

Transformer

做

NLP

前

⾔

计

算

机

视觉

、

机

器

学

习

，

这

两个

词

会

让

你

想

到

什么

？

相

信

绝

⼤多

数

⼈

第

⼀

反

应

都

是

CNN

，

⽽

持

续

关

注

这

些

领

域

发

展

的

⼈

，

则

会

进

⼀

步

联

想

到

近

⼏

年

⼤

⽕

的

Transformer

，

它

不

仅

在

⾃

然

语⾔

相

关

任

务

上

表

现

优

秀

，

在图

像

领

域

同

样

取

得

了

相

当

不

错

的

效

果

。

去

年

⽉

份

Google

推

出

的

Vision Transformer (ViT)

，

就

在图

像

识

别

任

务

上

⽤

更

⾼

的

学

习

效

率

，

达

到

了

不

亚于

ResNet

的

精

度

。

当

⼀个

模

型

性

能

达

到

SOTA

之

后

，

很

⾃

然

地

，

⼈们

就

会

想

去

探

究

它

的

原

理

，

并

和

先前

的

模

型

进

⾏

⽐

较

。

今

年

上

半

年

，

普林

斯

顿

⼤

学就

从

错

误

⼀

致

性

的

⻆

度

⽐

较

了

ViT

与

ResNet

，

最

终

发

现

ViT

更

容

易

错

判

形

状

相

似

的

物

体

，

⽽

ResNet

的

识

别

更

依

赖

纹

理

信

息

[1]

。

最

近

，

Google

则

对

⽹络

本

身

进

⾏

了

进

⼀

步

的

探

索

，

试

图

通过追

踪

模

型

学

习

表

征

的

过

程

，

确

认

ViT

和

ResNet

在

处

理

图

像

的

原

理

上

是

否

⼀

致

。

论

⽂

题

⽬

Do Vision Transformers See Like Convolutional Neural Networks?

⽩

鹡鸰

2021-09-06

18:05

原

创

夕

⼩

瑶

的

卖

萌

屋

论

⽂

链

接

http://arxiv.org/abs/2108.08810

⽅

法

ResNet

与

ViT

回

顾

在

开

始

研

究

区

别

之

前

，

我

们

先

快

速

回

顾

⼀下

ResNet

和

ViT

分别

是

谁

，

⻓

什么

样

。

⾸

先

是

ResNet

，

深

度

残

差

⽹络

，

2015

年

ImageNet

挑

战

赛

冠军

。

通过

如

下

图

所

示

的

残

差

块

实

现

⽹络

层

上

的

跳跃

，

从

⽽

将

模

型

的

优

化

⽬

标

从

寻

找

函

数

的

等

价

映

射

改

为了

逼近

零

，

弱

化

了

⽹络

变

深

对

模

型

性

能

的

负

⾯

影

响

。

⽬

前

为

⽌

，

基

于

ImageNet

数据

集

训

练

的

ResNet50

仍

然

是

图

像

处

理

任

务

中使

⽤

频

率

最

⾼

的

预

训

练

模

型

之

⼀

。

▲ResNet

核

⼼

部

件

——

残

差

块

▲ResNet

结

构

⽽

ViT

则

是

从

NLP

领

域

红

的

发

紫

的

Transformer

改

编

⽽

来

。

编

码

解

码的

结

构

，

中

间

加

⼀个

多头

注

意

⼒

机

制

。

ViT

主

要

的

改

变

就

是

在

输

⼊

端

，

将

图

像

进

⾏

了

分

块

和

降

维

，

从

⽽

将

图

像

变

成

⼀

种

类

似于

词语

编

码的

表

达

⽅

式

，

⽅

便了

后

续

处

理

。

经

过

了

这

⼀

⼩

步

的

改

动

，

ViT

在

JFT-300M

（

ImageNet

的

300

倍

放

⼤

版

，

亿

张

图

像

）上

预

训

练

的

模

型

成

功

超越

了

ResNet152 [2]

。

▲Vi T

结

构

超越

ResNet

虽

然

有

难

度

，

但也

算

不上

⼤

新

闻

。

ViT

能

引

起

讨论

热

度

的

主

要

原

因

是

它

跨

界

了

，不

仅

制

霸

NLP

，

如

今

还

可

能

给

翻

篇

。

这

样

的

可

能

性

⾃

然

是

让

⼈

坐

不

住了

，

如

果

存

在

⼀个

⽅

法

能

作为

不

同

模

态

不

同

类

型

任

务

的

通

解

，

那

⼤

⼀

统

时

代

说

不

定

也

就

不

远

了

。

那

么

，

在

这

⼀

美

好

愿

望

成

真

之

前

，

更

需

要

谨

慎

地

检

验

: Transformer

处

理

图

像

时

获

取

的

特

征

是

否和

之

前

主

流

的

CNN

有

所

区

别

？

如

果

它

们

虽

然

处

理

数据⽅

法

有

所

差

异

，

但

决

定

输

出

的

特

征

是

⾼

度

相

似

的

，

则

意

味

着⽬

前

的

模

型

已

经

接

近

了⼈

类

判

断

图

像

时

所

基

于

的

依

据

⽽

如

果

模

型

中

决

定

性

的

特

征

有

所

不

同

，

则

可

以

进

⼀

步

研

究

哪

⼀

种

特

征

对

信

息

的

表

征

效

果更

好

，

或

者

两

类

模

型

还

能

相

互借

鉴

，

从

⽽

获

得

新

⼀

轮

的

性

能

提

升

。

⽐

较

⽅

法

——CKA

基

于

这

样

的

动

机

，

Google

⽤

Centered Kernel Alignment (CKA)

对

ResNet

和

ViT

的

⼀

些

关

键

层

进

⾏

了

检

验

。

⾸

先

了

解

⼀下

CKA

这

种

⽅

法

。

CKA

是

Google

在

2019

年

提

出

的

，

⽤

于

衡

量

神

经⽹

络

中

层

与

层

之

间

相

似

度

的

指

标

[3]

。

假

设

想

要

检

测

的

两

层

⽹络

分别

有

和

个

神

经

元

，

取

个

样

本

通过

模

型

，

则分别

可

以

获

取和

的

表

征

矩

阵

。

基

于

点

积

的相

似

性

，

⾸

先

可

以

获

得

此

处

下

标

代

表

Frobenius

范

数

。

根

据

上

式

，

可

以

推

导

出

然

后

根

据

Hilbert-Schmidt Independence Criterion (HSIC)[3]

的

表

达

式

，

将

中

的

列

通过

核

函

数

对

应

到

上，

使

得

，，

可

以

得

到

HISC

的

经

验

估

计

值

评论收藏

内容反馈

版权申诉

QuietNightThought

粉丝: 1w+
资源: 632

谷歌：一篇论文，让研究者吃我三份安利.rar

谷歌：一篇论文，让研究者吃我三份安利.pdf

精典源码Delphi102：安利销售系统.rar

学习者团队+安利.pptx

五个购物网站网店系统源码打包.rar

绿色又环保的新型材料公司名字安利.doc

[详细完整版]互联网+安利.ppt

基于核心竞争力的企业品牌战略研究以安利公司为例毕业论文.doc

flask 蓝图.rar

安利品牌整合营销策划设计方案.pptx

Delphi：安利销售系统.zip源码Delphi项目程序源码下载

安利纽崔莱健康手册.pdf

安利奖金制度2013.ppt

安利综合分析报告.doc

安利杯 计算机比赛.pdf

安利最新OPP安利奖金制度.pptx

安利发展史PPT课件.pptx

《安利领导艺术》课程推介PPT.ppt

一个基于Java的接口快速开发框架，.rar

电脑分屏助手软件.rar

相关实用应用程序（Windows可用）

免费可用的ChatGPT网页版.zip

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

2023泛娱乐社交出海手册-ZEGO即构科技

4个亲测好用的ChatGPT4渠道

HAI-2024斯坦福AI指数报告（中文译版）.pdf

学术海报模板+论文科研+研究生

最新资源

安利杯计算机比赛.pdf