【免费】2021-面向深度学习的公平性研究综述1资源-CSDN文库

需积分: 0 90 浏览量 2022-08-04 00:41:41 上传评论收藏 1.71MB PDF 举报

资源推荐

资源详情

资源评论

计算机研究与发展

DOI

１０．７５４４∕issn１０００Ｇ１２３９．２０２１．２０２００７５８

JournalofCom

uterResearchandDevelo

ment ５８

(

２

２６４２８０

２０２１

收稿日期

２０２０

－

０９

－

１５

;

修回日期

２０２０

－

１０

－

２８

基金项目

国家自然科学基金项目

(

６２０７２４０６

);

浙江省自然科学基金项目

(

LY１９F０２００２５

);

宁波市

“

科技创新

２０２５

”

重大专项

(

２０１８B１００６３

)

Thisworkwassu

ortedb

theNationalNaturalScienceFoundationofChina

(

６２０７２４０６

theNaturalScienceFoundationof

Zhe

ian

Province

(

LY１９F０２００２５

andthe Ma

orS

ecialFundin

for

“

Scienceand Technolo

Innovation２０２５

”

in Nin

(

２０１８B１００６３

)

．

面向深度学习的公平性研究综述

陈晋音

１

２

陈奕芃

２

陈一鸣

２

郑海斌

２

纪守领

３

时

杰

４

程

瑶

４

１

(

浙江工业大学网络空间安全研究院

杭州

　３１００２３

)

２

(

浙江工业大学信息工程学院

杭州

　３１００２３

)

３

(

浙江大学计算机科学与技术学院

杭州

　３１００５８

)

４

(

华为国际有限公司新加坡研究院

新加坡

　１３８５８９

)

(

chen

in＠z

ut．edu．cn

)

FairnessResearchonDee

Learnin

ChenJin

１

２

ChenYi

２

ChenYimin

２

Zhen

Haibin

２

JiShoulin

３

ShiJie

４

andChen

Yao

４

１

(

Instituteo

bers

aceSecurit

Zhe

ian

Universit

Technolo

Han

zhou

３１００２３

)

２

(

Colle

ormationEn

ineerin

Zhe

ian

Universit

Technolo

Han

zhou

３１００２３

)

３

(

Colle

Com

uterScienceandTechnolo

Zhe

ian

Universit

Han

zhou

３１００５８

)

４

(

HuaweiInternationalPteLtd

Sin

ore

１３８５８９

)

Abstract　Dee

learnin

isanim

ortantfieldofmachinelearnin

research

whichiswidel

usedin

industr

for its

owerful feature extraction ca

abilities and advanced

erformance in man

lications．However

duetothebiasintrainin

datalabelin

andmodeldesi

researchshowsthat

dee

learnin

ravatehumanbiasanddiscriminationinsomea

lications

whichresultsin

unfairnessdurin

thedecisionＧmakin

rocess

thereb

willcausene

ativeim

acttobothindividuals

andsocials．Toim

rovethereliabilit

ofdee

learnin

and

romoteitsdevelo

mentinthefieldof

fairness

wereviewthesourcesofbiasindee

learnin

debiasin

methodsfordifferentt

esbiases

fairness measure metricsfor measurin

the effectof debiasin

and current

ular debiasin

latforms

basedontheexistin

research work．Intheend weex

loretheo

enissuesinexistin

fairnessresearchfieldandfuturedevelo

menttrends．

words　dee

learnin

;

orithmfairness

;

debiasin

method

;

fairnessmetric

;

machinelearnin

摘

要

深度学习是机器学习研究中的一个重要领域

它具有强大的特征提取能力

且在许多应用中表

现出先进的性能

因此在工业界中被广泛应用

．

然而

由于训练数据标注和模型设计存在偏见

现有的研

究表明深度学习在某些应用中可能会强化人类的偏见和歧视

导致决策过程中的不公平现象产生

从而

对个人和社会产生潜在的负面影响

．

为提高深度学习的应用可靠性

、

推动其在公平领域的发展

针对已

有的研究工作

从数据和模型

２

方面出发

综述了深度学习应用中的偏见来源

、

针对不同类型偏见的去

偏方法

、

评估去偏效果的公平性评价指标

、

以及目前主流的去偏平台

最后总结现有公平性研究领域存

在的开放问题以及未来的发展趋势

．

关键词

深度学习

;

算法公平性

;

去偏方法

;

公平性指标

;

机器学习

中图法分类号

　TP３９１

目前

深度学习算法已经取得了巨大的进步

并

且越来越多地用于影响个人生活的决策应用中

包

括图像分类

[

１

]

、

欺诈检测

[

２

]

、

情绪分析

[

３

]

、

面部识

别

[

４

]

、

语音理解

[

５

]

、

自动驾驶

[

６

]

、

医学诊断

[

７

]

等

深度

学习在这些复杂任务上的性能已经达到甚至超过了

人类决策的水平

能够实现比机器学习更高的准确

率

．

然而

深度学习在基于种族

、

年龄

、

性别等敏感属

性上的应用仍然具有不公平性

这种基于数据的学

习方法会过度关联敏感属性

可能会对受保护群体

表现出歧视行为

从而对个人和社会产生潜在的负

面影响

．

例如

美国法院使用

COMPAS

作为刑事司

法系统中的风险评估工具

用来衡量每一个被告再

次犯罪的概率

．

然而

对此工具的调查发现

COMPAS

对于种族这一敏感属性存在不公平性

非

裔美国人被告再次犯罪的风险估计平均高于白人被

告

[

８

]

．

在医学领域

年龄作为一种潜在的敏感属性

会影响基于深度学习诊断系统的评估结果

．

例如

来

自

UCI

机器学习知识库的

HeartDataset

包含了

９０６

名不同年龄段患者的

１４

个处理过的特征

[

９

]

．

这

个数据集的目标是准确地预测一个人是否患有心脏

病

而研究发现系统对年龄的偏见可能会导致不必

要的医疗护理

．

在某些简历筛选工具中

存在对性别

这一敏感属性产生歧视性行为的现象

导致男性在

应聘过程中比女性更有优势

．

深度学习在应用过程

中存在的不公平现象引起了业界和学术界的广泛关

注

[

１０

]

和

Ross

等人

[

１１

]

使用局部解释对深度模

型进行正则化训练从而实现模型的公平

;

Elazar

[

１２

]

和

Zhan

等人

[

１３

]

使用对抗性训练从模型的隐层表

示中去除敏感属性的信息

从而得到一个公平的分

类器

．

与机器学习方法相同

深度学习存在的偏见也

是来自于数据和模型

．

一方面

深度学习是基于数据

驱动的学习范式

它使模型能够自动从数据中学习

有用的表示

．

但是这些数据在标注过程中会引入偏

见

这些数据偏见被深度模型复制甚至放大

．

另一方

面

深度模型的结构是基于经验设计的

其训练是一

个黑盒过程

因此很难确定训练好的模型是基于正

确的理由做出的决定

还是受偏见影响做出的不公

平判断

这也使得模型去偏成为极具挑战性的任务

．

目前

面向深度学习的公平性研究领域还有很

大的发展空间

针对来自数据

、

模型的偏见问题已经

成为重点关注对象

仍需要不断的探索

．

同时由于深

度学习在高风险领域中的应用

对数据偏见的预处

理去偏

、

对模型偏见的中处理去偏

、

以及后验性去偏

方法

正在引起业界和学术界的关注

．

为了更好地探究深度学习的公平性与未来的发

展方向

本文将综述深度学习偏见的不同来源并分

类

对预处理去偏方法

、

深度模型的公平性训练方法

以及后验去偏方法进行介绍

并列举目前主流的面

向深度学习的去偏平台及去偏方法的公平性评估指

标

同时对未来可能的研究方向作出展望

．

１　

偏见的来源

由于训练数据标注和深度模型结构设计本身存

在偏见

会导致深度学习任务的预测结果存在不公

平现象

．

根据偏见的来源不同

我们将偏见类型分为

数据偏见和模型偏见

．

１．１　

数据偏见

训练数据中可能存在由历史社会原因产生的偏

见

在有偏见的数据上学习的模型可能会导致预测

结果的不公平性

．

数据的偏见会以多种形式存在

Suresh

等人

[

１４

]

讨论了数据偏见的不同来源

以及这

些偏见的产生方式

;

Olteanu

等人

[

１５

]

准备了一份完

整的不同类型偏见的列表

并对由于数据偏见而产

生的后果进行分析

;

Mehrabi

等人

[

１６

]

总结了以上

２

篇论文中引入的一些最普遍数据偏见的来源

但是

缺少对偏见来源的细粒度分类

．

在本文中

我们将介绍这些数据偏见的定义并

进行详细说明

此外还将按照发生的原因对这些数

据偏见进行细粒度的分类

．

我们将其分为时间偏见

、

空间偏见

、

行为偏见

、

群体偏见

、

先验偏见

、

后验偏见

．

１．１．１　

时间偏见

时间偏见是指由于时间维度的差异引起的偏

见

．

例如

在

Twitter

上可以观察到一个例子

人们

谈论一个特定的话题时开始使用标签来吸引注意

力

然后不使用标签继续讨论该事件

[

１５

１７

]

这是由

不同时期人群和行为的差异产生的

[

１５

]

．

另一个典型

的时间偏见是纵向数据偏见

观察性研究经常把横

断面数据当作纵向的

．

例如

对大量

数据的

分析显示

评论长度会随着时间的推移而减少

[

１８

]

．

然而

大量的数据代表的是人口的横截面快照

实际上包含了不同年份加入

的不同群体

．

当

数据按队列分列时

发现每个队列中的评论长度随

时间增加

[

１８

]

．

时间偏见可能会导致数据缺失

对后

续的分析统计带来困难

．

１．１．２　

空间偏见

空间偏见主要指的是由数据空间维度产生的偏

见

也就是常说的维数灾难

．Verle

sen

等人

[

１９

]

指出

５６２

陈晋音等

面向深度学习的公平性研究综述

基于学习原理的数据分析工具可从学习样本中推断

出知识或信息

．

显然

通过学习建立的模型仅在可获

得学习数据的空间范围内有效

．

模型不可能对与所

有学习点都不相同的数据进行概括

．

因此

成功开发学习算法的关键要素之一就是

要有足够的数据进行学习

以便它们可以填充模型

必须包含的空间

．

在保持其他所有约束不变的情况

下

学习数据的数量应随维度呈指数增长

例如

学

习二维数据需要

１００

个具有相同平滑度的模型

;

对

于

３

维模型

则需

１０００

个

．

指数级增长是维数灾难

后果

这些数据通常会对算法的行为和性能产生不

利影响

．

对于这类偏见

我们通常采用降维的方法进

行偏见的减轻

．

１．１．３　

行为偏见

行为偏见可以分为社会行为偏见

[

２０Ｇ２１

]

和用户行

为偏见

[

２１

]

．

其中社会行为偏见是由社会历史固有的

偏见或者他人的行为引起的偏见

可分为社会偏

见

[

２０

]

、

紧急偏见

[

２２

]

、

历史偏见

[

１４

]

、

资助偏见

[

１６

]

．

社会

偏见

[

１８

]

的产生是由于他人的行为可能会影响我们

的判断

例如

用户想要评价或回顾一个得分较低的

项目

但当受到其他高评分的影响时

用户可能认为

自己太过苛刻

从而会改变自己的评分

[

２０Ｇ２１

]

．

紧急偏

见

[

２２

]

的发生由于人口

、

文化价值观或社会知识的变

化而产生的

这种偏见更可能在用户界面中被观察

到

因为通过设计

界面倾向于反映未来用户的能

力

、

特征和习惯

．

历史偏见

[

１４

]

是指世界上已经存在

的偏见和社会技术问题

即使给定一个完美的采样

和特征选择

也会渗透到数据生成过程中

．

资助偏

见

[

１６

]

是指当公司为了满足资助机构的要求而进行

虚假报告

从而出现人为的偏见

．

例如

当公司的员

工为了让资助机构满意而在他们的数据和统计中报

告进行杜撰

使报告结果产生偏见

．

用户行为偏见

[

２３

]

源于跨平台

、

上下文或不同数

据集的不同用户行为

．

这类偏见的典型例子可在

Miller

等人

[

２４

]

的研究中观察到

其中作者展示了不

同平台之间的表情符号表达的差异如何导致人们的

不同反应和行为

有时甚至导致交流错误

．

用户行为

偏见可以分为用户交互偏见

[

２３

]

、

内容产生偏见

[

２３

]

和流行偏见

[

２３

]

．

用户交互偏见

[

２３

]

不仅可以在

Web

上观察到

而且可以从

２

个来源触发

———

用户界面

和通过用户自己选择的偏见行为

[

１６

]

．

这种偏见可能

会受到其他类型和子类型的影响

比如呈现偏见

[

２０

]

和排名偏见

[

２０

]

．

呈现偏见

[

２０

]

是信息如何呈现的结

果

例如

在

Web

上

用户只能单击他们看到的内

容

因此其他内容不会被单击

也可能是用户没有看

到

Web

上的所有信息

．

排名偏见

[

２０

]

是由于人们认为

排名靠前的搜索结果是最相关

、

最重要的

这种想法

会吸引更多的点击量

．

这种偏见影响了搜索引擎

[

２０

]

和众包应用程序

[

２５

]

．

内容产生偏见

[

１５

]

源于用户生成

的内容在结构

、

词汇

、

语义和句法上的差异

．

例如

等人

[

２６

]

讨论了不同性别和年龄群体在使用

语言方面的差异

．

流行偏见

[

２７Ｇ２８

]

是由于越受欢迎的

物品越容易被曝光

．

这种偏见可以在搜索引擎或推

荐系统中看到

在这些系统中

受欢迎的对象会更多

地呈现给公众

．

行为偏见会使用户在决策过程中受

到其他外界因素的影响

导致获得的信息不足或者

带有偏见

从而产生歧视性行为

．

１．１．４　

群体偏见

[

１５

]

产生于数据集或平台中所表示的

用户群体中的统计数据

、

代表数据和用户特征与原

始目标群体不同的时候

．

典型的例子是对于不同社

交平台上不同用户的统计数据

女性更倾向于使用

、

Facebook

、

Insta

ram

等社交平台

而男性

在

或

Twitter

等在线论坛上更活跃

．Huan

等人

[

２９

]

调查了根据性别

、

种族

、

民族和父母教育背

景划分的年轻人使用社交媒体的例子和数据

．

群体偏见可分为聚集偏见

[

１４

]

和

Sim

son

悖论

[

３０

]

．

聚集偏见

[

１４

]

是由于人们观察其他不同的子群体得

出错误结论时或者对一个群体的错误假设影响模型

的结果和定义时产生的

．

例如

在临床辅助工具中用

于糖尿病诊断和监测的糖化血红蛋白水平在不同性

别和种族之间存在复杂的差异

．

由于这些因素以及

它们在不同的子群体中的不同意义和重要性

单一

的模型很可能不适合一个群体中的所有群体

[

１４

]

．

Sim

son

悖论

[

３０

]

可能会对由不同行为的子群

体或个体组成的异构性数据的分析产生偏见

．

这类

悖论的一个比较著名的例子是对加州大学伯克利分

校的性别歧视诉讼

[

３１

]

．

在分析了研究生院的招生数

据后

可以发现与男性相比

女性被录取为研究生的

比例更小

．

然而

当对各个院系的招生数据进行分析

后发现女性申请者具有平等的地位

在某些情况下

甚至比男性小有优势

．Sim

son

悖论在许多领域都

得到了观察

包括生物学

[

３２

]

、

心理学

[

３３

]

、

天文学

[

３４

]

和计算社会科学

[

３５

]

．

群体偏见会导致用户得到错误

的数据

从而得到错误的结论

．

１．１．５　

先验偏见

先验偏见发生在我们选择

、

利用和测量特定特

征的方式上

．

先验偏见可以分为抽样偏见

[

１６

]

、

自我

６６２

计算机研究与发展

　２０２１

５８

(

２

)

剩余16页未读，继续阅读

评论收藏

内容反馈

傅融

粉丝: 26
资源: 333

2021-面向深度学习的公平性研究综述1

面向深度学习的公平性研究综述.pdf

面向深度学习的公平性研究综述.docx

公平性机器学习研究综述.pdf

计算机视觉中的深度学习：方法、解释、因果关系和公平性-研究论文

基于众包的反思性学习模式设计与实践--面向深度学习的课堂教学结构化变革研究之三.pdf

知识建构环境下STEM学习发生的内在机制及作用效度分析--面向深度学习的课堂教学结构化变革研究之四.pdf

面向实时应用的深度学习研究综述.pdf

面向深度学习的多模态融合技术研究综述.pdf

面向深度学习的多模态融合技术研究综述_何俊.pdf

《视频图像技术原理与案例》第21章-面向深度学习的智能化图像处理环境搭建 深度学习原理.pptx

2021-2022收藏资料面向对象程序设计最终作业.doc

2021-2022收藏资料面向对象程序设计-复习题.doc

面向深度学习模型的对抗攻击与防御方法综述.pdf

人工智能-深度学习-人工智能-深度学习面向视觉特征表达的深度学习算法研究.zip

深度学习：面向核心素养培育的教学变革——深度学习文献综述.pdf

面向自然语言处理的深度学习对抗样本综述.pdf

基于深度学习的图像语义分割技术研究综述.pdf

capgemini-面向首席营销官的新剧本-为什么CMOs应该支持实时营销以推动持续增长（英）-2021-48页.pdf

藏经阁-面向深度效果的广告投放系统介绍.pdf

深度学习入门-Python语言学习-15面向对象其他-入门学习

深度学习入门-Python语言学习-14面向对象继承-入门学习

BurpLoaderKeygen.jar.zip

最新版ISO/IEC 27001:2022、ISO 27002:2022中英文合集

Goby红队版-win-x64-2.4.7版本

Chrome Header Editor 插件

ISO SAE 21434-2021 中文版.pdf

OpenVAS GVM 中文翻译补丁

安全认证cisp教材全套

最新资源

《视频图像技术原理与案例》第21章-面向深度学习的智能化图像处理环境搭建深度学习原理.pptx