没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
垂直领域下的智能问答系统设计
1 背景需求
基于业务或行业领域知识库为背景,可实现基于自然语言方式的智能问答。从而为用户提供更
自然和便捷的信息获取。对于该类问题也可以更简便的称之为 KB-QA,即基于知识库的问答。
智能问答系统是将积累的无序语料信息,进行有序和科学的整理,并建立基于知识的分类模型;
这些分类模型可以知道新增加的语料咨询和服务信息,节约人力资源,提供信息处理的自动型,降
低系统运行成本。基于对系统多年积累的关于政府和企业的基本情况长江问题及其解答,整理为规
范的问答库形式,以支撑各种形式问题的智能问答。方便了用户,提高了办事效率,提升了企业和
政府形象。
本系统拟研发智能系统关键技术方案,从而形成可通用的智能问答产品,以满足各类型业务或
领域问答需求。实现后的智能问答产品将提供标准的知识输入规范,用户可根据各业务或领域知识
进行标准化梳理录入,从而形成专业的智能问答服务系统,产品提供两类问答服务接口:定制的聊
天式界面接口、标准的 RESTFul 接口。
2 功能需求
以一问一答的形式,精确定位用户所需要的提问知识,并给用户提供交互服务。
相关问题推送:当用户提出问题时,系统不仅将问题的答案推送出来,而且会将于这个问题相
关的只是也都推送出来供用户查询,这样就做到了一次提问全面掌握所有信息。
提问智能提示:用户在提问的过程中,系统将已经输入的内容自动分析给予优化的补全或相关
提示。
焦点问题自动排行:对在一定的时间内,用户对知识提问的热度,系统自动聚焦,并按照访问
频度将热点知识集中在系统页面上显示;具体类别的只是也按照访问频度排序,在页面知识类别栏
目中显示。·
热点词聚焦:系统对用户提交的业务关键词进行统计,并按照访问的频度进行聚焦,将于关键
词相关的业务列表自动链接,形成业务热点关键词。
在线客服问答:模拟在线客服人员,以系统智能客服形式完成客服作用
引导式交互客服服务:将长剑问题整理成若干流程诊断性的知识,通过引导交互式的服务,尽
量从 web 端解决客户常见问题。
转人工服务:用户可以直接在智能咨询服务系统中链接人工服务,向客服人员进行在线咨询。
3 一些概念
智能问答系统:以一问一答的形式,精确的定位用户所需要提问的知识,通过用户和系统的交
互,为用户提供个性化的信息服务。
KB: Knowledge Base, 知识库,知识库是人 工智能的经典概念之一。最早是作为专 家系统
(Expert System)的组成部分,用于支持推理。知识库中的知识有很多种不同的形式,例如本体知
识、关联性知识、规则库、案例知识等。相比于知识库的概念,知识图谱更加侧重关联性知识的构
建,如三元组。
KB-QA: 知识库问答(Knowledge Base Ques!on Ansower),即给定自然语言形式下的问题,通过
对问题进行语义理解和解析,进而利用知识库进行查询,推理得出答案。 从应用领域的角度划分,
知识库问答可以分为开放域的知识问答,如百科知识问答,和特定域的只是问答,如金融领域、医
疗领域、宗教领域、政务服务等,以客服机器人,教育/考试机器人或搜索引擎等形式服务于我们
的日常生活。
命名实体识别:Named En!ty Recogni!on,NER,又称作“专名识别”,是指识别文本中具有特定
意义的实体,主要包括人名、地名、机构名、专有名词等。
语义网
[1]
:Seman!c Web, 或叫语义互联网,语义互联网的核心内涵是:Web 不仅仅要通过超
链接把文本页面链接起来,还应该把事物链接起来,使得搜索引擎可以直接对事物进行搜索,而不
仅仅是对网页进行搜索。谷歌知识图谱是语义互联网这一理念的商业化实现。也可以把语义互联网
看做是一个基于互联网共同构建的全球知识库。
链接数据
[2]
: Linked Data, 强调语义互联网的目的是要建立数据之间的链接,而非仅仅是把结构
化的数据发布到网上。他为建立数据之间的链接制定了四个原则。从理念上讲,链接数据最接近于
知识图谱的概念。但很多商业知识图谱的具体实现并不一定完全遵循 Tim 所提出的那四个原则。
语义网络
[3]
:Seman!c Network, 由相互连接的节点和边组成,节点表示概念或者对象,边表示
他们之间的关系(is-a 关系,比如:猫是一种哺乳动物;part-of 关系,比如:脊椎是哺乳动物的一部
分)。是由 Collins、Quillian 于上世纪 60 年代提出的知识表达模式。相比起知识图谱,早期的语义网
络更加侧重描述概念以及概念之间的关系,而知识图谱更加强调数据或事物之间的链接。
本体
[4]
:Ontology,本体本身是个哲学名词。在上个世纪 80 年代,人工智能研究人员将这一概
念引入了计算机领域。Tom Gruber 把本体定义为“概念和关系的形式化描述”, 通俗点讲,本体相似
于数据库中的 Schema,主要用来定义类和关系,以及类层次和关系层次等。OWL 是最常用的本体
描述语言。本体通常被用来为知识图谱定义 Schema。
RDF: Resource Descrip!on Framework,即资源的描述框架,其本质是一个数据模型。它提供了
一个统一的标准,用于描述实体/资源。简单来说,就是表示事物的一种方法和手段。RDF 形式上
表示为 SPO 三元组,有时候也称为一条语句(statement),知识图谱中我们也称其为一条知识,
如下图。目前,RDF 序列化的方式主要有:RDF/XML,N-Triples,Turtle,RDFa,JSON-LD 等几种。
RDFS: Resource Descrip!on Framework Schema,基础的模式语言(或者叫资源描述框架的元模
型),RDFS/OWL 本质上是一些预定义词汇(vocabulary)构成的集合,用于对 RDF 进行类似的类定
义及其属性的定义。如下图:Data 层是用 RDF 对知识图的具体描述,Vocabulary 是自己定义的一些
词汇(类别,属性),RDF(S)则是预定义词汇。从下到上是一个具体到抽象的过程。图中我们用红
色圆角矩形表示类,绿色字体表示 rdf:type,rdfs:domain,rdfs:range 三种预定义词汇,虚线表示
rdf:type 这种所属关系。
OWL: Web Ontology Language,最常用的本体描述语言。RDFS 本质上是 RDF 词汇的一个扩展。
后来人们发现 RDFS 的表达能力还是相当有限,因此提出了 OWL。Tom Gruber 把本体定义为“概念和
关系的形式化描述”,分别指实体的类层次和关系层次。从技术概念上来说我们也可以把 OWL 当做
剩余19页未读,继续阅读
资源评论
Ensurer
- 粉丝: 13
- 资源: 122
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功