【免费】P202210011-KHP221122109.0YS-陈杰-对比学习在搜索排序&召回模型训练中的一种应用方法-二稿-22110资源-CSDN文库

需积分: 0 198 浏览量 2023-02-01 16:30:21 上传评论收藏 272KB DOCX 举报

资源推荐

资源详情

资源评论

KHP221122111.3YS

1

业务类别

发明专利申请实用新型专利申请外

观设计专利申请

申请号

2022114872147

全体发明人姓名

陈杰

发明人

第一发明人身份证号（国

籍）

特别要求

申请同时提实审要求提前公开

要求本国优先权要求国外优先权

是否需要涉外申请提醒提交菌种保藏证明

（生化类）

备注

快速预审

填表日期： 2022 年 11 月日

5

10

KHP221122111.3YS

1

权利要求书

1、一种模型训练方法，其特征在于，包括：

从数据记录日志中，提取出第一数量的待用于对数据匹配模型进

行训练的匹配行为记录数据；其中，各所述匹配行为记录数据均包括

5 相对应的待匹配数据和标注有样本类别标识的至少一条反馈数据，所

述样本类别标识包括正样本标识和负样本标识；

按照同一所述匹配行为记录数据中正样本匹配度高于负样本匹

配度的训练目标，利用各所述匹配行为记录数据对所述数据匹配模型

进行训练；其中，所述正样本匹配度为标注有所述正样本标识的所述

10 反馈数据与所述待匹配数据的匹配度，所述负样本匹配度为标注有所

述负样本标识的所述反馈数据与所述待匹配数据的匹配度。

2、根据权利要求 1 所述的模型训练方法，其特征在于，所述数

据匹配模型为数据搜索模型或数据推荐模型。。

3、根据权利要求 1 所述的模型训练方法，其特征在于，所述按

15 照同一所述匹配行为记录数据中正样本匹配度高于负样本匹配度的

训练目标，利用各所述匹配行为记录数据对所述数据匹配模型进行训

练，包括：

分别确定各所述匹配行为记录数据的对比损失；

基于各所述匹配行为记录数据的对比损失，确定综合对比损失；

20 基于所述综合对比损失，更新所述数据匹配模型的模型参数。

4、根据权利要求 3 所述的模型训练方法，其特征在于，所述分

别确定各所述匹配行为记录数据的对比损失，包括：

基于交叉熵计算方式，计算出各所述匹配行为记录数据的对比损

失。

25 5、根据权利要求 3 所述的模型训练方法，其特征在于，所述基

于各所述匹配行为记录数据的对比损失，确定综合对比损失，包括：

将各所述匹配行为记录数据的对比损失输入到综合对比损失确

Commented [陈杰 1]: 专利这面所说的数据推荐模型是指

召回模型和推荐排序模型两种吗？

Commented [cnkip2R2]: 已按照沟通修改

2

定模型中，获得所述综合对比损失确定模型输出的所述综合对比损失；

其中，所述综合对比损失确定模型用于在获得各所述匹配行为记

录数据的对比损失后，计算出各所述匹配行为记录数据的对比损失的

和值，将所述和值除以反馈数据总数量所获得的值确定为所述综合对

5 比损失，所述反馈数据总数量为所有所述匹配行为记录数据中反馈数

据的总数量。

6、根据权利要求 4 所述的模型训练方法，其特征在于，当所述

数据匹配模型为搜索排序模型排序模型时，确定所述待匹配数据与所

述反馈数据的匹配度，包括：

10 将所述待匹配数据和所述反馈数据输入到第一特征提取网络，获

得所述第一特征提取网络输出的目标向量距离；

将所述目标向量距离确定为所述待匹配数据与所述反馈数据的

匹配度；

其中，所述目标向量距离是由所述第一特征提取网络通过以下步

15 骤生成：分别从已输入的所述待匹配数据和所述反馈数据中提取出第

一特征向量和第二特征向量，计算出所述第一特征向量和所述第二特

征向量的向量距离，将计算出的向量距离确定为所述目标向量距离。

利用第一特征提取网络，分别从所述待匹配数据和所述反馈数据

中提取出第一特征向量和第二特征向量；

20 将所述第一特征向量与所述第二特征向量的向量距离确定为所

述待匹配数据与所述反馈数据的匹配度。

7、根据权利要求 4 所述的模型训练方法，其特征在于，当所述

数据匹配模型为召回模型时，确定所述待匹配数据与所述反馈数据的

匹配度，包括：

25 利用第二特征提取网络，从所述待匹配数据中提取出第三特征向

量；

利用第三特征提取网络，从所述反馈数据提取出第四特征向量；

Commented [陈杰 3]: 将所述待匹配数据和所述反馈数据

输入第一特征提取网络，输出距离表达式，作为述待匹配

数据和所述反馈数据的匹配度。

Commented [cnkip4R4]: 已相应修改

剩余36页未读，继续阅读

内容反馈

lala_13

粉丝: 0
资源: 6

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip