没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
37页
本发明提供一种模型训练方法及装置,可以从数据记录日志中,提取出第一数量的匹配行为记录数据;其中,各匹配行为记录数据均包括相对应的待匹配数据和标注有样本类别标识的至少一条反馈数据,样本类别标识包括正样本标识和负样本标识;按照同一匹配行为记录数据中正样本匹配度高于负样本匹配度的训练目标,利用各匹配行为记录数据对数据匹配模型进行训练;其中,正样本匹配度为标注有正样本标识的反馈数据与待匹配数据的匹配度,负样本匹配度为标注有负样本标识的反馈数据与待匹配数据的匹配度。本发明可以优化对数据匹配模型的训练效果,使得数据匹配模型可以匹配到以及向用户展示更能满足用户实际需求或更感兴趣的数据。
资源推荐
资源详情
资源评论
KHP221122111.3YS
1
业务类别
发明专利申请 实用新型专利申请 外
观设计专利申请
申请号
2022114872147
全体发明人姓名
陈杰
发明人
第一发明人身份证号(国
籍)
特别要求
申请同时提实审 要求提前公开
要求本国优先权 要求国外优先权
是否需要涉外申请提醒 提交菌种保藏证明
(生化类)
备 注
快速预审
填表日期: 2022 年 11 月 日
5
10
2
说 明 书 摘 要
本发明提供一种模型训练方法及装置,可以从数据记录日志中,
提取出第一数量的匹配行为记录数据;其中,各匹配行为记录数据均
包括相对应的待匹配数据和标注有样本类别标识的至少一条反馈数
5 据,样本类别标识包括正样本标识和负样本标识;按照同一匹配行为
记录数据中正样本匹配度高于负样本匹配度的训练目标,利用各匹配
行为记录数据对数据匹配模型进行训练;其中,正样本匹配度为标注
有正样本标识的反馈数据与待匹配数据的匹配度,负样本匹配度为标
注有负样本标识的反馈数据与待匹配数据的匹配度。本发明可以优化
10 对数据匹配模型的训练效果,使得数据匹配模型可以匹配到以及向用
户展示更能满足用户实际需求或更感兴趣的数据。
KHP221122111.3YS
1
摘 要 附 图
从数据记录日志中,提取出第一数量的待用于对数据匹配模
型进行训练的匹配行为记录数据;其中,各匹配行为记录数
据均包括相对应的待匹配数据和标注有样本类别标识的至少
一条反馈数据,样本类别标识包括正样本标识和负样本标识
按照同一匹配行为记录数据中正样本匹配度高于负样本匹配
度的训练目标,利用各匹配行为记录数据对数据匹配模型进
行训练;其中,正样本匹配度为标注有正样本标识的反馈数
据与待匹配数据的匹配度,负样本匹配度为标注有负样本标
识的反馈数据与待匹配数据的匹配度
S101
S102
KHP221122111.3YS
1
权 利 要 求 书
1、一种模型训练方法,其特征在于,包括:
从数据记录日志中,提取出第一数量的待用于对数据匹配模型进
行训练的匹配行为记录数据;其中,各所述匹配行为记录数据均包括
5 相对应的待匹配数据和标注有样本类别标识的至少一条反馈数据,所
述样本类别标识包括正样本标识和负样本标识;
按照同一所述匹配行为记录数据中正样本匹配度高于负样本匹
配度的训练目标,利用各所述匹配行为记录数据对所述数据匹配模型
进行训练;其中,所述正样本匹配度为标注有所述正样本标识的所述
10 反馈数据与所述待匹配数据的匹配度,所述负样本匹配度为标注有所
述负样本标识的所述反馈数据与所述待匹配数据的匹配度。
2、根据权利要求 1 所述的模型训练方法,其特征在于,所述数
据匹配模型为数据搜索模型或数据推荐模型。。
3、根据权利要求 1 所述的模型训练方法,其特征在于,所述按
15 照同一所述匹配行为记录数据中正样本匹配度高于负样本匹配度的
训练目标,利用各所述匹配行为记录数据对所述数据匹配模型进行训
练,包括:
分别确定各所述匹配行为记录数据的对比损失;
基于各所述匹配行为记录数据的对比损失,确定综合对比损失;
20 基于所述综合对比损失,更新所述数据匹配模型的模型参数。
4、根据权利要求 3 所述的模型训练方法,其特征在于,所述分
别确定各所述匹配行为记录数据的对比损失,包括:
基于交叉熵计算方式,计算出各所述匹配行为记录数据的对比损
失。
25 5、根据权利要求 3 所述的模型训练方法,其特征在于,所述基
于各所述匹配行为记录数据的对比损失,确定综合对比损失,包括:
将各所述匹配行为记录数据的对比损失输入到综合对比损失确
Commented [陈杰 1]: 专利这面所说的数据推荐模型是指
召回模型和推荐排序模型两种吗?
Commented [cnkip2R2]: 已按照沟通修改
2
定模型中,获得所述综合对比损失确定模型输出的所述综合对比损失;
其中,所述综合对比损失确定模型用于在获得各所述匹配行为记
录数据的对比损失后,计算出各所述匹配行为记录数据的对比损失的
和值,将所述和值除以反馈数据总数量所获得的值确定为所述综合对
5 比损失,所述反馈数据总数量为所有所述匹配行为记录数据中反馈数
据的总数量。
6、根据权利要求 4 所述的模型训练方法,其特征在于,当所述
数据匹配模型为搜索排序模型排序模型时,确定所述待匹配数据与所
述反馈数据的匹配度,包括:
10 将所述待匹配数据和所述反馈数据输入到第一特征提取网络,获
得所述第一特征提取网络输出的目标向量距离;
将所述目标向量距离确定为所述待匹配数据与所述反馈数据的
匹配度;
其中,所述目标向量距离是由所述第一特征提取网络通过以下步
15 骤生成:分别从已输入的所述待匹配数据和所述反馈数据中提取出第
一特征向量和第二特征向量,计算出所述第一特征向量和所述第二特
征向量的向量距离,将计算出的向量距离确定为所述目标向量距离。
利用第一特征提取网络,分别从所述待匹配数据和所述反馈数据
中提取出第一特征向量和第二特征向量;
20 将所述第一特征向量与所述第二特征向量的向量距离确定为所
述待匹配数据与所述反馈数据的匹配度。
7、根据权利要求 4 所述的模型训练方法,其特征在于,当所述
数据匹配模型为召回模型时,确定所述待匹配数据与所述反馈数据的
匹配度,包括:
25 利用第二特征提取网络,从所述待匹配数据中提取出第三特征向
量;
利用第三特征提取网络,从所述反馈数据提取出第四特征向量;
Commented [陈杰 3]: 将所述待匹配数据和所述反馈数据
输入第一特征提取网络,输出距离表达式,作为述待匹配
数据和所述反馈数据的匹配度。
Commented [cnkip4R4]: 已相应修改
剩余36页未读,继续阅读
资源评论
lala_13
- 粉丝: 0
- 资源: 6
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功