没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
36页
本发明提供一种模型评估方法、装置、设备及介质,可以获得待用于评估问答对话模型的问答数据集;其中,问答数据集中包括至少一类问题对应的问答数据子集,各问答数据子集均包括相应类别问题下的至少一个问答对,各问答对均包括相对应的问题和标准答案;基于各问答数据子集,评估问答对话模型对各类别问题的回答效果。本发明可以有效评估问答对话模型对于不同类别问题的回答效果,从而有效评估问答对话模型的问题回答效果,定向优化问答对话模型对相应类别问题的处理性能,提高模型优化效率,减少相关训练资源的消耗。
资源推荐
资源详情
资源评论
KHP221122111.3YS
1
业务类别
发明专利申请 实用新型专利申请 外
观设计专利申请
申请号
2022114630025
全体发明人姓名
陈杰
发明人
第一发明人身份证号(国
籍)
特别要求
申请同时提实审 要求提前公开
要求本国优先权 要求国外优先权
是否需要涉外申请提醒 提交菌种保藏证明
(生化类)
备 注
快速预审
填表日期: 2022 年 11 月 日
5
10
2
说 明 书 摘 要
本发明提供一种模型评估方法、装置、设备及介质,可以获得待
用于评估问答对话模型的问答数据集;其中,问答数据集中包括至少
一类问题对应的问答数据子集,各问答数据子集均包括相应类别问题
5 下的至少一个问答对,各问答对均包括相对应的问题和标准答案;基
于各问答数据子集,评估问答对话模型对各类别问题的回答效果。本
发明可以有效评估问答对话模型对于不同类别问题的回答效果,从而
有效评估问答对话模型的问题回答效果,定向优化问答对话模型对相
应类别问题的处理性能,提高模型优化效率,减少相关训练资源的消
10 耗。
KHP221122111.3YS
1
摘 要 附 图
获得待用于评估问答对话模型的问答数据集;其中,问答数
据集中包括至少一类问题对应的问答数据子集,各问答数据
子集均包括相应类别问题下的至少一个问答对,各问答对均
包括相对应的问题和标准答案
基于各问答数据子集,评估问答对话模型对各类别问题的回
答效果
S101
S102
KHP221122111.3YS
1
权 利 要 求 书
1、一种模型评估方法,其特征在于,包括:
获得待用于评估问答对话模型的问答数据集;其中,所述问答数
据集中包括至少一类问题对应的问答数据子集,各所述问答数据子集
5 均包括相应类别问题下的至少一个问答对,各所述问答对均包括相对
应的问题和标准答案;
基于各所述问答数据子集,评估所述问答对话模型对各类别问题
的回答效果。
2、根据权利要求 1 所述的模型评估方法,其特征在于,所述基
10 于各所述问答数据子集,评估所述问答对话模型对各类别问题的回答
效果,包括:
对于任一所述问答数据子集:将所述问答数据子集中各所述问答
对中的问题,分别输入到所述问答对话模型中,获得所述问答对话模
型分别针对所述问答数据子集中各问题输出的模型回答,基于各问题
15 对应的标准答案和模型回答的比较结果,确定所述问答对话模型对目
标类别问题的回答效果;所述目标类别问题为一个与所述问答数据子
集相对应的所述类别问题。
3、根据权利要求 2 所述的模型评估方法,其特征在于,所述基
于各问题对应的标准答案和模型回答的比较结果,确定所述问答对话
20 模型对与所述问答数据子集相对应的目标类别问题的回答效果,包括:
分别获得各问题对应的标准答案和模型回答的相似度比较结果;
基于各问题对应的标准答案和模型回答的相似度比较结果,确定
所述问答对话模型对与所述问答数据子集相对应的目标类别问题的
回答效果。
25 4、根据权利要求 1 所述的模型评估方法,其特征在于,所述获
得待用于评估问答对话模型的问答数据集,包括:
获得初始问答数据集,所述初始问答数据集中包括多个所述问答
2
对;
分别将所述初始问答数据集中的各所述问答对输入到训练好的
问答分类模型中,获得所述问答分类模型分别针对所述初始问答数据
集中的各所述问答对输出的问题类别标识;
5 将对应同一所述问题类别标识的各所述问答对确定为一个所述
问答数据子集;
将确定出的各所述问答数据子集组合为所述问答数据集。
5、根据权利要求 1 所述的模型评估方法,其特征在于,在所述
基于各所述问答数据子集,评估所述问答对话模型对各类别问题的回
10 答效果之前,所述模型评估方法还包括:
分别确定各所述问答数据子集中所述问答对的数量;
当一个所述问答数据子集中所述问答对的数量不大于预设数量
阈值时,添加相应类别问题下的第一数量的问答对至所述问答数据子
集中。
15 6、根据权利要求 1 所述的模型评估方法,其特征在于,在所述
基于各所述问答数据子集,评估所述问答对话模型对各类别问题的回
答效果之前,所述模型评估方法还包括:
分别确定各所述问答数据子集中所述问答对的数量;
根据已确定出的各所述问答数据子集中所述问答对的数量,通过
20 添加问答对或减少问答对的方式,调整各所述问答数据子集中所述问
答对的数量,以使得调整后的各所述问答数据子集中所述问答对的数
量满足预设比例关系。
7、根据权利要求 5 或 6 所述的模型评估方法,其特征在于,在
所述基于各所述问答数据子集,评估所述问答对话模型对各类别问题
25 的回答效果之后,所述模型评估方法还包括:
基于所述问答对话模型对各类别问题的回答效果,评估所述问答
对话模型的整体模型性能。
剩余35页未读,继续阅读
资源评论
lala_13
- 粉丝: 0
- 资源: 6
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- html动态爱心代码一(附源码)
- c40539bc-071a-486c-9d52-9d0c18d62dac 4.html
- 基于物理的非视域成像(NLOS)算法,利用了nerf+python源码+文档说明
- yuluer知更鸟.7z(1).001
- python课程设计-基于tensorflow实现的图文生成程序,数据集flickr30k-images+源代码+文档说明+截图
- python作业-基于Flickr30k数据集实现图像文本跨模态搜索python源码+数据集+测试界面+项目说明(高分课程设计)
- 基于Qt实现医院信息管理系统c++源码+文档说明+数据库(期末大作业)
- 基于python实现的医院信息管理系统完整源码+sql数据库+详细注释(高分课程设计)
- 基于python的眼底图像视杯视盘分割项目源码+文档说明+截图演示+详细注释(高分课程设计)
- ImageBasedModellingEdu-贰壹贰叁零
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功