没有合适的资源?快使用搜索试试~ 我知道了~
基于特征融合的中文知识库问答方法1
需积分: 0 0 下载量 62 浏览量
2022-08-04
15:24:22
上传
评论
收藏 293KB PDF 举报
温馨提示
试读
7页
引言基于知识库的问答(Konwledge Based Question Answering, KBQA)[1] 是自然语言处理领域的热门研究方向。知识库问答的主
资源详情
资源评论
资源推荐
基于特征融合的中文知识库问答方法
汪洲 侯依宁 汪美玲 李长亮 *
AI Lab, KingSoft Corp, Beijing, China
{wangzhou1, houyining, wangmeiling1, lichangliang }@kingsoft.com
Abstract. 知识库问答即 KBQA 是自然语言处理领域的热点、难点问题。
本文提出一种基于特征融合的中文知识库问答方法。此方法的 pipeline 主
要由 mention 识别、实体链接、问句分类、路径生成、路径排序、答案检
索六个部分组成,其创新点在于采用了多种特征融合策略,通过充分融合
各个阶段挖掘的语义信息和覆盖浅层、深层的多级特征,从知识库中更加
精准地召回答案。本文方法在 CCKS 2020 CKBQA 测试集 TestB 达到了
86.078% 的 F1 值。
Keywords: 知识库问答,实体链接,路径排序,特征融合.
1 引言
基于知识库的问答(Konwledge Based Question Answering, KBQA)[1] 是
自然语言处理领域的热门研究方向。知识库问答的主要任务是接收一个自然语
言问句为输入,识别问句中的实体、理解问句的语义关系、构建关于实体和关
系的查询语句,进而从既有知识库中检索答案。例如针对问句“龙卷风的英文
名是什么?”,基于知识库中 [< 龙卷风 _(一种自然天气现象)> < 外文名 >
“Tornado” ] 三元组形式的知识,知识库问答给出答案“Tornado”。
知识库问答的主要方法包括基于语义解析 (Semantic Parsing, SP) 的方法和
基于信息检索 (Information Retrieval, IR) 的方法两大类。基于语义解析的方法
直接从自然语言问句中解析出实体、关系及逻辑组合,转化为知识库上的查询
语句并从知识库查询返回答案。例如 Wang 等人 [6] 利用序列标注模型解析问句
中的实体、利用端到端模型解析问句中的关系序列。基于语义解析的方法通常
依赖大量人力进行关系分类的标注,难以预测训练集中未出现的关系。基于信
息检索的方法在问句实体识别与实体链接的基础上,从知识库中召回候选实体
相关路径,并依据与问句的语义匹配进行路径排序,进而选择最可能的路径从
知识库中检索答案。例如 Yu 等人 [8] 提出增强路径匹配的方法,实现问句与候
选路径的多层次匹配。相比于基于语义解析的方法,基于信息检索的方法在路
径选择方面具有更好的泛化能力,能够应用在较大的知识库中。
2020 年,新型冠状病毒疫情爆发,OpenKG 搭建了以新冠为核心的高质量
知识图谱,并提出新冠知识图谱构建与问答相关的四个测评任务。其中,任务四
“新冠知识图谱问答评测”要求针对输入的中文问句从给定知识库中选择若干实
体或属性值作为答案返回,问句覆盖简单类型与复杂类型,例如单实体多度问
句、多实体问句。本文针对任务四提出了一种基于特征融合的中文知识库问答
方法,此方法采用基于信息检索的方法实现,该方法的 pipeline 主要由 mention
识别、实体链接、问句分类、路径生成、路径排序、答案检索六个阶段组成。为
了从知识库中更加精准召回答案,本方法采用了多种特征融合策略,具体是在路
艾法
- 粉丝: 20
- 资源: 319
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0