没有合适的资源?快使用搜索试试~ 我知道了~
可信AI治理框架探索与实践.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 97 浏览量
2023-02-23
16:44:12
上传
评论
收藏 534KB DOCX 举报
温馨提示
试读
25页
可信AI治理框架探索与实践.docx
资源推荐
资源详情
资源评论
0 引言
人工智能(AI)的蓬勃发展是人类社会的重大历史事件,其开创了一个新
的时代
[1]
。随着 AI 技术的快速发展,AI 应用的规模愈加庞大,IDC 预测 AI 应
用市场规模有望在 2024 年突破 5 000 亿美元大关
[2]
。但随着 AI 应用的深入,
一些深层次问题逐渐暴露出来,比如使用脸部照片、人脸视频、3D 头套等方
式恶意欺骗人脸识别系统
[3]
;在交通标志上添加一个不显眼的对抗扰动,误导
并改变自动驾驶汽车的行车路线
[4]
;通过毒化数据的方式,在模型中添加后门,
从而控制模型的行为
[5]
;“大数据杀熟”
[6]
和“数字剥削”
[7]
等恶意使用 AI 的行为。
上述 AI 安全伦理问题引发了人们对 AI 系统可信性的担忧,阻碍了 AI 的进一
步发展,已经成为亟待解决的问题。
如何打造可信的 AI 系统已经成为政府、企业的关注重点。本文分析了 AI
系统在当下遇到的可信问题与挑战,从技术和管理两个维度出发,提出了一种
通 用 的 可 信 AI 治 理 框 架 ——T-DACM ( trusted data & algorithm &
computation &management)。T-DACM 具体包括可信数据、可信算法、可
信计算、可信管理 4 个层次,覆盖了数据安全、模型安全、隐私保护、风险控
制、过程管理、可解释性、公平伦理、追溯追责等 AI 热点问题的解决方法,
为企业及监管机构提供了一种可行的可信 AI 解决方案。
1 国内外研究进展
可信是 AI 技术的自身要求,也是 AI 产业发展的要求。统计模型存在类似
“射手假说”[8]的问题,AI 不可避免地有被误用、滥用、恶意使用的风险。为了
降低这些风险,国外对可信 AI 的研究主要从安全及数据隐私方面入手,兼顾 AI
使用过程中的伦理道德,制定了相关的法律法规。
2014 年 Goodfellow I J 等人
[9]
提出用模型对抗训练的方法来防御对抗样本
攻击,增强模型的安全性;2016 年 Ribeiro M T 等人
[10]
提出一种生成解释方法
来解释模型的决策过程,提升模型决策的透明性;2018 年 Gidaris S 等人
[11]
提
出一种元学习方法来提高模型在未知领域数据上的泛化能力,降低模型的误用
风险;2019 年 Nguyen H H 等人
[12]
提出使用多任务学习的方法来提高模型的领
域泛化能力,降低模型误判的风险;2019 年 Iosifidis V 等人
[13]
提出一种基于重
采样的方法来消除数据中的偏见,提升模型的公平性;2021 年 Sauer A 等人
[14]
提出一种反事实图片的生成方法来协助分类模型找到更稳定的因果特征,提升
模型的泛化能力。
与此同时,在可信 AI 治理指导原则方面,2018 年欧盟提出了《人工智能
道德准则》,提出可信 AI 的 5 个指导原则:福祉原则、不作恶原则、自治原
则、公正原则、可解释性原则
[15]
;2020 年 Shin J 等人
[16]
提出构建一个可信 AI
系统需要重点考虑 AI 应用的再现性、可解释性和公平性;2020 年英国信息专
员办公室提出了《解释 AI 做出的决定》,提出算法透明度可以从原理解释、
责任解释、数据解释、公平性解释、安全与可靠性解释及影响解释 6 个方面实
现
[17]
。2021 年,Winter P M 等人
[18]
提出,可信的 AI 应用需要重点关注机器学
习(machine learning,ML)关键理论理解、质量评估手段、领域泛化、置信
度量手段、道德伦理、用户可接受度、抗攻击能力等方面。
国内对可信 AI 的技术研究基本与国外同步,在可信 AI 治理配套的法规方
面,从网络安全、数据安全、个人信息多维度入手,更加全面,职责明确,易
于实施。在可信 AI 技术研究方面,2017 年 Meng D Y 等人
[19]
提出基于数据增
强和样本检测的 MagNet 方法来防御对抗样本攻击;2018 年 Kuang K 等人
[20]
提出一种基于样本加权的因果预测算法 DGBR 来提高模型对未知环境的适应
能力;2019 年 Zhang Q S 等人
[21]
提出一种基于决策树的替代模型方法来解释
卷积神经网络(convolutional neural network,CNN)模型的决策逻辑;2019
年 FENG R 等人
[22]
提出一种基于对抗框架的数据表示方法来消除数据集中对特
定群体的偏见;2021 年 Zhao Y Y 等人
[23]
提出一种多源元学习框架来增强模型
的领域泛化能力。
在可信 AI 治理指导原则方面,我国于 2016 年颁布了《中华人民共和国网
络安全法》,要求网络运营者保障网络免受干扰、破坏或者未经授权的访问,
防止网络数据泄露或被窃取、篡改。2019 年我国提出了《新一代人工智能治
理原则——发展负责任的人工智能》,强调了和谐友好、公平公正、包容共享、
尊重隐私、安全可控等 8 条原则,从而逐步实现可审核、可追溯、可信赖的
AI
[24]
; 2020 年 中 国 信 息 通 信 研 究 院 提 出 了 《 人 工 智 能 安 全 框 架 ( 2020
年)》,其从 AI 安全技术、AI 安全管理两个方面设计 AI 安全框架,对 AI 安
全能力进行分级,提出了合法合规、功能可靠可控、数据安全可信、决策公平
公正、行为可解释、事件可追溯的 AI 安全目标
[25]
;2021 年 6 月通过的《中华
人民共和国数据安全法》要求机构开展数据处理活动时,应当遵守法律、法规,
尊重社会公德和伦理,遵守商业道德和职业道德,诚实守信,履行安全保护义
务、承担社会责任,不得危害国家安全、公共利益,不得损害个人、组织的合
法权益;2021 年 8 月通过的《中华人民共和国个人信息保护法》要求机构在
利用个人信息进行自动化决策时,要建立算法影响评估制度进行事前风险评估,
建立算法审计制度审计活动遵守法律、法规的情况,保证决策的透明度和结果
公平合理。
综上所述,围绕可信 AI 的问题,学术界、产业界及政府均进行了不同方
向的探索,取得了一些成果,但可信 AI 的落地尚存在一些问题:首先,大多
可信方面的研究还停留在理论分析阶段,在产业界尚未进行大规模应用;其次,
可信 AI 涉及的技术领域较广,目前尚缺少一个通用模式将诸多可信 AI 技术有
机结合起来;最后,针对 AI 系统的行为,缺乏完善的监管系统。因此,需要
一个统一的可信 AI 治理框架,对可信 AI 涉及的管理及技术因素进行统筹考虑,
以满足学术界、产业界及政府三方对可信 AI 的迫切需求,完成 AI 系统由可用
系统向可信系统的转变。
2 可信 AI 治理框架简介
本文在现有理论及技术研究的基础之上,结合应用场景,对可信 AI 治理
进行了探索与实践,提出了 T-DACM ,如图 1 所示。
T-DACM 由下而上分为 4 层,分别是可信数据(trusted data)层、可信
算法(trusted algorithm)层、可信计算(trusted computation)层、可信管理
(trusted management)层,具体如下。
● 可信数据层为可信 AI 提供了数据基础。其具体包含异常数据检测、偏
倚消除、偏见消除、数据增强等组件,可以检测异常样本,保证模型正常工作,
对异常数据、异质性数据进行处理,引入公平性算法消除数据中的歧视与偏见,
通过样本变换或者样本生成来扩增数据集,增强模型的鲁棒性。
图 1
图 1 T-DACM
● 可信算法层为可信 AI 提供安全与强鲁棒性的核心能力。除了现有算法,
其还包含因果算法、公平算法、模型增强等算法组件,可以从数据中发现稳定
特征,提高模型对不同环境的适应能力,去除模型的决策逻辑对弱势群体的歧
视,提升模型对常见攻击方式的防御能力。
● 可信计算层为可信 AI 提供可信计算的能力。其具体包括加密算法、可
信计算、计算调度等模组,可以使用加密算法及可信平台控制模块(trusted
platform control module,TPCM)保障单方计算场景下的数据安全,使用联邦
学习、联邦计算、安全多方计算(secure multi-party computation,MPC)等
组件为多方参与的模型训练、模型推理、计算等保障数据安全。
剩余24页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3675
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于Python的新能源承载力计算及界面设计源码 - HAINING-DG
- 基于Java的本科探索学习项目设计源码 - 本科探索
- 基于Javascript和Python的微商城项目设计源码 - MicroMall
- 基于Java的网上订餐系统设计源码 - online ordering system
- 基于Javascript的超级美眉网络资源管理应用模块设计源码
- 基于Typescript和PHP的编程知识储备库设计源码 - study-php
- Screenshot_2024-05-28-11-40-58-177_com.tencent.mm.jpg
- 基于Dart的Flutter小提琴调音器APP设计源码 - violinhelper
- 基于JavaScript和CSS的随寻订购网页设计源码 - web-order
- 基于MATLAB的声纹识别系统设计源码 - VoiceprintRecognition
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功