"大模型知识Out该怎么办?浙大团队探索大模型参数更新的方法—模型编辑" 大模型知识Out该怎么办?浙大团队探索大模型参数更新的方法—模型编辑,这篇论文探索了大模型参数更新的方法,提出了一种新的概念“Model Editing(模型编辑)”,旨在实现大模型参数的实时更新。模型编辑的目的是在特定领域内对模型数据进行有效的变更,同时不会对其他输入的结果造成不利影响。 模型编辑的过程旨在使用编辑描述符,即上图中关于信息 “谁是美国总统?-拜登” 的问题答案对,去调整基础模型,得到一个编辑后的模型,并且使得整个模型的更新过程更加高效。 模型编辑还要求对当前领域内的“编辑”不会影响到其他领域内输入的正常输出结果,形式化的表述即需要:其中, 表示 的“有效邻居”, 则表示超出 作用范围的领域。 一个编辑后的模型应当满足以下三点,分别是可靠性、普适性与局部性。可靠性即编辑后模型应该可以正确的输出编辑前模型错误的例子,可以通过编辑案例的平均准确率来衡量。普适性表示对于 的“有效邻居”,模型都应该可以给出正确的输出,这点可以对编辑案例领域数据集进行均匀抽样衡量平均正确率来衡量。最后局部性,即表示编辑后模型在超出编辑范围的例子中仍然应该保持编辑前的正确率,可以通过分别测算编辑前编辑后的平均准确率来对局部性进行刻画。 论文还探索了当前的模型编辑方法,包括基于记忆或内存的模型编辑方法和修改模型的内部参数的方法。前者是通过增加额外参数来实现模型编辑,而后者是通过修改模型的内部参数来实现模型编辑。 基于记忆或内存的模型编辑方法的代表方法是 SERAC,这种方法是 Mitchell 等人于 2022 年提出的一种模型编辑方法,核心思想在于保持模型原始参数不变,通过一个独立的参数集重新处理修改后的事实,该方法可以实现在特定领域内对模型数据进行有效的变更,同时不会对其他输入的结果造成不利影响。 T-Patcher 和 CaliNET 是基于 SERAC 的基础上发展起来的模型编辑方法,这些方法向 PLMs 的前馈模块中引入额外可训练的参数,而不是额外外挂一个模型,这些参数在修改时可以提供更加灵活和高效的模型编辑方式。 大模型知识Out该怎么办?浙大团队探索大模型参数更新的方法—模型编辑,这篇论文探索了大模型参数更新的方法,提出了一种新的概念“Model Editing(模型编辑)”,旨在实现大模型参数的实时更新,并探索了当前的模型编辑方法,包括基于记忆或内存的模型编辑方法和修改模型的内部参数的方法,为大模型参数更新提供了更加灵活和高效的解决方案。
剩余11页未读,继续阅读
- weixin_389998332023-10-01这个资源总结的也太全面了吧,内容详实,对我帮助很大。
- 粉丝: 1238
- 资源: 5535
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助