没有合适的资源?快使用搜索试试~ 我知道了~
意图知识图谱的构建与应用.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 61 浏览量
2022-11-13
14:43:34
上传
评论
收藏 1.47MB DOCX 举报
温馨提示
试读
17页
意图知识图谱的构建与应用.docx意图知识图谱的构建与应用.docx
资源推荐
资源详情
资源评论
摘要:政府治理的效果评估是一个难题。没有很好的评估方法和评估体系,政府治理的效果
就不能得到很好的保障。提出从自然语言问答的角度理解网民在政府治理话题中的意图,并
通过构建意图知识图谱,关联语义等价的问题和意图。不同意图又通过实体的相互关联,支
持意图的关联和对比。给出了意图知识图谱的定义、构建框架和政府治理场景的使用范例,
展示了意图知识图谱是解决政府治理的效果评估问题的一种有效方法。在政府治理的场景
中,利用意图知识图谱可以分析对比同一治理话题下不同治理主体之间的意图场,从而深入
剖析特定治理主体在特定治理话题下的效果,并发现治理中存在的问题。
关键词: 意图理解 ;知识图谱 ;自然语言问答 ;实体识别
1 引言
人工智能和大数据等技术在政府治理中发挥的作用日益突显, 交通、医疗、城市规划、
一站式政务服务、 灾情疫情应急处理等越来越多的市政服务应用开始尝试利用大数据
与人工智能技术。我国政府也在强调利用大数据等技术手段推进政府决策科学化、社
会治理精准化、公共服务高效化。随着政府治理大数据应用的开展,评估政府治理的
效果成为迫在眉睫的事情。没有有效的评估机制和手段,就无法深入利用和改进大数
据技术,无法有效地将政府治理与大数据技术深度结合,导致难以真正做到政府决策
的科学化、社会治理的精准化以及公共服务的高效化。一种可能的评估手段是从政府
内部构建治理的评估机制,相对公众用户而言,政府具有更好的数据优势,能够通过
政府治理的多种应用场景收集数据,通过自评估的方式评价治理的效果。然而,由政
府自身主导的治理效果评价也可能会存在一些问题。首先,尽管政府具有较好的公信
力,但也不能排除在数据采样或发布手段等方面出现问题,使得评估效果偏离实际,
不能真正发挥导向作用;其次,很多政府治理场景需要跨部门的协作与评估,不同部
门之间数据共享困难,难以协作评价治理的效果。因此,政府单方面的治理效果评估
机制会存在一定的问题。另一种政府治理效果的评估手段是从公众的角度、从用户的
角度评估政府治理的效果。一般需要使用问卷调查的方式收集大量的用户反馈,才能
有效地评估政府治理的效果。然而,使用问卷收集公众反馈进行有效评估是非常困难
的事情,最突出的问题就是只能获得书面的社会信息,而不能了解生动、具体的社会
情况。其次,问卷回复率和有效率低,对无回答者的研究比较困难,反馈人群的偏差
和反馈数据的偏差会造成很大的评估偏差, 从而无法实现有效评估政府治理效果的目
的。本文通过收集互联网上多种来源(如网页论坛、微博、百度知道和知乎等问答社
区)的用户自然语言问题,并对问题进行分析处理,将其抽象成问题背后的意图。如
果 2 个意图语义相同,或者包含相同的实体、词条,那么它们之间就可以建立关联,
进而构建公众意图知识图谱。进一步结合政府治理的一些应用场景,分析公众意图在
不同城市的不同政府治理话题下的分布差异性,分析公众意图的演化规律,进而评估
一些政府治理的应用场景的治理效果。采用自然语言问题构建意图知识图谱,并用来
评估政府治理效果有以下原因:第一,相比搜索引擎的用户搜索日志,自然语言问题
更详细(搜索日志多为关键词) ,意图表达更精确; 第二,用户搜索日志多为搜索引擎
公司的私有数据,难以公开研究和应用,也缺少第三方数据的公立性;第三,相比网
页和社交媒体的文本数据,用户的自然语言问题意图更明显、表达更精炼,更有利于
精准识别用户的意图;第四,社交媒体上与政府治理相关的数据通常带有强烈的主观
色彩,煽动性强,真假混杂,而自然语言问题通常是用户意图的自然表达,不是情绪
的宣泄,用自然语言问题分析潜在的政府治理效果受到的干扰会更小;第五,社区的
自然语言问题,除了问题,通常还有答案以及用户对问题及答案的反馈数据,这更有
利于识别问题的意图以及问题的质量和重要性;第六,互联网上尤其是问答社区(如
百度知道、搜狗问问等)拥有大量的公众用户问题,具有良好的数据基础。基于以上
考虑,笔者认为从互联网上爬取的海量自然语言问答数据非常适合构建意图知识图谱,
适合在这样的知识图谱上分析政府治理的效果。现代汉语词典将意图定义为“希望达
到某种目的打算”。 意图知识图谱是对指定领域的问题意图的结构化整理, 以知识图谱
的形式呈现,便于计算机处理以及人们理解分析。基于此,本文创新性地提出构建意
图知识图谱,并给出一个概要性的解决方案。那么,意图知识图谱与一般意义的知识
图谱有什么相同和不同之处?知识图谱需要具有节点和边的概念,
传统知识图谱的节
点表示信息实体或者实体的属性值, 边表示 2 个被连接实体的关系或者一个实体的某
个属性。在意图知识图谱中,节点与传统知识图谱相同,是一个具体的信息实体或词
条。意图的形式化表达逻辑上是由多个实体或词条构成的集合, 它以超边( hyper edge )
的形式连接其包含的多个实体和词条,进而表达一个意图。边则可以有多种类型,如
实体和词条之间的边,与传统的知识图谱相同,这些边用于实体之间的关联,表示实
体的属性、实体和概念之间的上下位本体关系或者对某个实体属性施加的动作;意图
超边和实体 /词条节点之间的连接,表示某个意图超边包含了这些实体
图的描述;意图之间的边可以表示意图之间的等价关系(具有相同的意图)或者是在
具体应用下构建的意图之间的相关关系(意图之间的某种关联) 。有了上述的意图知
/词条,是对意
识图谱,就可以在给定的由实体和词条形成的意图下,分析它们涵盖的意图范围,提
取与查询相关的子知识图谱,根据其等价关系进行聚类,对不同意图之间的关联性进
行分析,形成意图场(子知识图谱) 。因此,意图知识图谱是异构信息网络的变种,它
有不同类型的信息实体、不同类型的边(包括超边) 。下面将研究如何构建意图知识
图谱以及如何将意图知识图谱应用到政府治理的场景中。
图 1 意图知识图谱的构建框架
2 意图知识图谱的构建
从问题句子构建意图知识图谱的过程与传统知识图谱的构建过程不同,
需要先做问句
的抽取和提问意图主体的识别,以便下一步的意图聚类和分析。在很多政务治理场景
下,意图分析强调意图的时效性,因此无法直接以现有的百科知识图谱为基础进行构
建。图 1 给出了意图知识图谱的构建框架,它主要包括数据获取、信息抽取、知识融
合、质量评估和知识更新 4 个模块。
2.1 数据获取
按数据来源,数据可分为 3 类:万维网;新浪微博、腾讯微博等短消息广播平台;百
度知道、搜狗问问、知乎等问答社区。本节将从收集技术、清洗整理、数据抽取这
个方面评析万维网、微博、问答社区数据获取的质量和效率。万维网数据包含了来自
3
剩余16页未读,继续阅读
资源评论
xxpr_ybgg
- 粉丝: 6550
- 资源: 3万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功