没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![doc](https://img-home.csdnimg.cn/images/20210720083327.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/release/download_crawler_static/89159061/bg1.jpg)
你的 A I 真的是你的吗?利用 B lockcha i n 进行
版权 s 、出处和世系
Yilin Sai
1,2
, Qin Wang
1,2
, Guangsheng Yu
1
, H.M.N. Dilum Bandara
1,2
, Shiping Chen
1,2
1
CSIRO Data61 |
2
The University of New South Wales , Sydney, Australia
A
bstr
act
—
随着人工智能(
AI
)融入各个领域,尤其是在内
容生成方面,确保合法所有权和合乎道德的使用变得至关重要。
人工智能服务提供商应优先考虑负责任地采购训练数据并从数据
所有者那里获得许可证。然而,现有的研究主要集中在保护静态
版权上,它只是将元数据
/
数据集视为具有可转让
/
交易能力的不
可替代项目,而忽略了可以塑造持续轨迹的训练程序的动态性质
。
在本文中,我们介绍了 IBis ,一个为 AI 模型训练工作流程
量身定制的基于区块链的框架。IBis 集成了数据集、许可证和
模型的链上注册表,以及链下签名服务,以促进多个参与者之间
的协作。我们的框架解决了有关数据和模型来源以及版权合规性
的问题。IBis 支持迭代模型重新训练和微调,并提供灵活的许
可证检查和续订。此外,IBis 还提供旨在与现有合同管理软件
无缝集成的 API,最大限度地减少对已建立模型训练流程的干
扰。我们在 Canton 区块链上使用 Daml 实现 IBis 。评估结
果展示了 IBis 在不同数量的用户、数据集、模型和许可证中的
可行性和可扩展性。
Index Terms—AI, Blockchain, License, Provenance,
Trust
I.
介
绍
基于大型语言模型(
LLM
)的应用程序的激增
[
?
],
[
?
]
代表了人工智能(
AI
)技术融入日常生活各个方面的一个
重要里程碑,从信息检索
[
?
],
[
?
]
到内容生成
[
?
],
[
?
]
。与
此同时,人工智能服务提供商在将其服务商业化方面取得了
长足的进步。然而,由于
LLM
和其他
AI
模型依赖于从不
同来源聚合的大量数据集进行训练
[
?
],
[
?
]
,因此在数据
获取和模型训练过程中出现了对版权
[
?
],
[
?
],
[
?
]
潜在侵权
的担忧。为了维护负责任和合乎道德的人工智能实践
[
?
],
[
?
]
、遵守法规并减少法律责任,人工智能服务提供商必须积极
与数据所有者合作,包括内容创作者和媒体行业利益相关
者。在利用数据进行
AI
模型训练之前,建立许可协议
[
?
],
[
?
]
并征得同意是此次合作的关键要素
[
?
]
。因此,越
来越需要新的框架来解决人工智能行业的数据来源、沿袭和
版权合规性问题,并根据其独特的需求和工作流程进行定制
。
然而,解决人工智能数据来源和版权合规性的问题可能
是一项艰巨的任务,特别是当整个训练过程发生在本地或
黑匣子云服务中 [?] ,限制了用户的透明度。为了弥合这
一差距,我们利用区块链技术的特性,它提供了一个防篡
改和值得信赖的环境 [?] 建立真实性、出处和血统 [?], [?]
。由于其固有的不变性和透明性,区块链已被广泛认可为
实现监管合规的合适技术 [?], [?], [?] 。例如,记录在区
块链上的数据经过数字签名,具有固有的防篡改性,从而
构成了真实且持久的记录,可以准确反映特定时间点的事
件。这使得区块链成为解决人工智能行业内与数据来源和
版权合规相关的问题的合适候选者 [?], [?], [?] 。
我们已经确定了在开发这种基于区块链的合规框架时必
须解决的一系列功能挑战:(i)该框架必须设计为与现有
![](https://csdnimg.cn/release/download_crawler_static/89159061/bg2.jpg)
的人工智能模型训练工作流程无缝集成。(ii)该框架应支持
使用新数据集进行持续的模型再训练和微调,允许生成更新
的模型,同时保持数据来源和沿袭。(iii)该框架应支持许可
证到期和续期机制,以适应数据所有者采用的各种业务模式
。(
iv
)数据集和模型的所有权以及所有训练行动都应附有
证据,以澄清其许可范围,并确保对任何后续行动负责。(
v
)该框架应促进人工智能服务提供者和数据所有者之间的沟
通,以便有效地达成和记录许可协议。(六)该框架应确保
许可证的有效管理和商业敏感性,保护许可证不受第三方未
经授权的查阅。
在本文中,我们设计、实现和评估了
IBis
,这是一个
基于区块链的框架,用于
AI
模型训练过程中的数据和模
型版权管理、出处和沿袭。
IBis
使模型所有者能够在整个
再训练和微调过程中建立其
AI
模型和训练数据集的来源
和血统,有效地从相关版权所有者那里获得版权许可,并
安全地记录和更新双边签署的版权许可作为法律合规的证
据。我们的详细贡献如下:
•
我们提出了一个区块链集成框架,IBis ,用于跟踪数据
并建模版权管理、出处和世袭。IBis 具有以下特点:
⋄ 无缝集成(解决 c-i):通过支持迭代模型重新训练
和微调,通过灵活的许可证检查和续订来适应不同
的版权协议,并提供与现有合同生命周期管理软件
集成的统一 API,该框架确保对已建立的模型训练
和版权管理流程的干扰最小。
⋄
适应性(解决
c-ii
和
iii):通过在模型元数据中的模
型之间建立链接,并通过智能合约集成定期许可证续
订检查,
IBis
支持持续的模型再训练和许可证续订。
此外,链上许可证注册利用区块链的不变性,允许模
型所有者和版权所有者检索他们过去的许可证,以证
明合规性并避免任何争议。
⋄
可追溯注册表(寻址
c-iv
):通过为数据集元数据、
许可证和模型元数据部署三个链上不可变注册表,
该框架维护数据集和模型关系、所有权及其版权协议
的真实记录。这些记录之间的双向链接可实现整个数
据的双向可追溯性,并模拟版权管理、出处和沿袭流
程。
⋄ 基于区块链的多方签名(寻址 c-v):通过利用私有
许可区块链提供的身份管理和数字签名功能,IBis
在 AI 模型所有者和版权所有者之间实现高效和安
全的多方签名工作流程,确保建立合法合规的许可
协议。
⋄ 可 控性(寻址 c-vi ):通过实施链上访问控制机制
并遵守严格的权限规则,IBis 确保只有授权方才能
访问与训练数据集、模型和许可证相关的信息。因
此,IBis 促进了一个包含许多人工智能模型、数据
![](https://csdnimg.cn/release/download_crawler_static/89159061/bg3.jpg)
2
集和许可证的生态系统,使模型和数据所有者能够
利用统一平台的网络效应,同时保护他们的商业敏
感性需求。
•
我们实现了一个基于
Daml
智能合约语言
[
?
]
和
Can
ton
区块链协议
[
?
]
的全功能原型
1
。我们采用
了
Daml
和
Can
ton
著名的隐私保护功能和模块化设
计,以实施一个安全且保护商业敏感性的框架,该框架
具有六个专门用于许可证注册、管理和更新的模块。
•
我们对 IBis 进行了一系列性能评估,特别是其在参
数化真实场景下的性能。评估结果表明,模型所有者
可以分别在大约 1.5 秒和 3 秒内检索模型的数据集及
其许可证。这与框架中托管的模型所有者、数据集和
许可证的数量无关。此外,检索许可证的授权模型大
约需要 1.5 秒,无论每个模型的训练数据集数量、模
所有权的新方法,并在铸造时自动声明所有权。许可是授
予或转让作品权利的主要方法。创作者可以通过在许可协
议中指定条款和条件来控制权利范围。许可证可能会有很
大差异,从授予广泛的权限到将使用限制在特定目的或时
间范围内。
B.
相关工作
保护人工智能中的版权
/
数据。人工智能服务中的数据和版
权保护是一个由来已久的话题。现有的方法可以分为几个
方面
[
?
]
:数据修改方法涉及修改或清理用户数据以取消
他们与特定个人的链接(例如,
k-anon
ymit
y
[
?
]
,
differen
tial
priv
acy
[
?
]
,
and
w
atermarking
[
?
]
)。这通
过删除或隐藏个人身份信息(
PI
I
)将重新识别的风险降
至最低。数据加密方法利用同态加密
[
?
]
和安全多方计算
型所有者和框架内的许可证如何。这些结果证明了在
不同数量的用户、数据集、模型和许可证下的可伸缩
性。
本文的其余部分组织如下:第 ?? 节提供背景和相关工
作。第 ?? 节给出了系统架构和我们的设计。我们框架的
(MPC) [?], [?] 等技术,对用户数据进行加密,以确保数
据共享过程中的完整性和机密性。数据最小化方法旨在通过
减少所需的个人数据量来提高效率
[
?
]
,通常在一般模型
训练中观察到,在训练期间不需要
PI
I
数据,在推理过程
中也不需要
PI
I
数据。数据限制方法涉及人工智能方法,
构建细节,包括数据模型和功能操作,在第 ?? 节中介绍。
第 ?? 节和第 ?? 节通过绩效评估来介绍我们的实施情况。
第 ?? 节提供了结论,并提出了未来研究的途径。
II.
预
赛
A.
背
景
AI
模型训练。一般来说,
AI
模型的训练过程是连续的、迭代
的,包括训练、再训练、微调
[
?
]
。如图所示。
??
,训练从
数据收集开始,其中通过数据抓取收集初始训练数据集。然
后,这些数据集被输入到模型训练步骤中,在该步骤中训练
初步模型。为了确保模型保持有效和最新,它会定期使用新
收集的数据进行再训练,使其能够适应新信息。此外,模型
可能会经历微调阶段,在该阶段对其进行轻微的重新训练以
满足特定的领域要求,从而提高其准确性和对目标应用程序
的相关性。
Fig. 1: 典型的 AI 模型训练过程。
版权。版权授予创作者对其原创表达的专有权,例如文学、
艺术和音乐作品。这一法律框架保障了创作者的权利,使他
们能够控制其作品的使用、复制和发行方式。版权保护在
创建时是自动的,但它是隐含的,需要额外的步骤才能得
到适当的保护。首先,在版权局注册作品可以提供权威的
法律证据,证明其所有权和侵权情况下的法定损害赔偿资
格。其次,添加带有创作者姓名和创作年份的版权声明
(©),告知他人版权主张 [?] ,类似于图片上的签名。
此外,NFTs [ ?] 提供了一种通过区块链技术嵌入数字艺
术
1
Open 于 https://github.com/yilin-sai/ai-copyright-framework 发
布。
剩余17页未读,继续阅读
资源评论
![avatar-default](https://csdnimg.cn/release/downloadcmsfe/public/img/lazyLogo2.1882d7f4.png)
![avatar](https://profile-avatar.csdnimg.cn/6750b37de580461eb63f0e30917f4cff_weixin_41429382.jpg!1)
百态老人
- 粉丝: 4572
- 资源: 2万+
![benefits](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-1.c8e153b4.png)
下载权益
![privilege](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-2.ec46750a.png)
C知道特权
![article](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-3.fc5e5fb6.png)
VIP文章
![course-privilege](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-4.320a6894.png)
课程特权
![rights](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-icon.fe0226a8.png)
开通VIP
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback-tip](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)