没有合适的资源?快使用搜索试试~ 我知道了~
DBpedia知识库本体分析
需积分: 23 107 下载量 78 浏览量
2015-07-08
11:42:31
上传
评论 3
收藏 189KB DOCX 举报
温馨提示
试读
12页
DBpedia知识库本体分析 在现有的语义网项目架构中,基于关联数据形式的知识库项目往往处于整个语义网络的核心,如何对于这些知识库的知识内容进行组织、储存和查找就成为了决定整个语义网络运行效率的关键因素。在目前的关联数据知识库项目中,DBpedia是较为典型且成熟的一个,DBpedia网站使用本体的方法来对其条目内容进行组织和存储,本文旨在通过对DBpedia现有本体结构的分析来说明知识库的本体结构对于知识库的组织、存储和查找有着怎样的影响,并试图从该例中分析归纳得出类似网站知识库内容的本体构建的一般要点。
资源推荐
资源详情
资源评论
DBpedia 知识库本体分析
[摘要]在现有的语义网项目架构中,基于关联数据形式的知识库项目往往处于整个语义网
络的核心,如何对于这些知识库的知识内容进行组织、储存和查找就成为了决定整个语义
网络运行效率的关键因素。在目前的关联数据知识库项目中, 是较为典型且成熟
的一个, 网站使用本体的方法来对其条目内容进行组织和存储,本文旨在通过对
现有本体结构的分析来说明知识库的本体结构对于知识库的组织、存储和查找有
着怎样的影响,并试图从该例中分析归纳得出类似网站知识库内容的本体构建的一般要点。
[关键词]关联数据 本体 本体构建
1. 概述及相关简介
年, 网络的发明者 提出了语义网的概念。这一概念的核心在于
致力提高万维网络及其互联的资源的可用性和有效性,使得下一代的互联网更加智能和高
效,能够有效处理目前网络中的大量信息内容。这一概念和其具体的技术实现几经波折,
从一开始的基于本体的构想到 年 提出的关联数据概念,在目前的语义网
构想中,关联数据成为了其技术实现的核心概念。
关联数据是一种推荐的最佳实践,用来在与以往中使用 和 发布、分享、连接
各类数据、信息和只是,发布和部署实例数据和类数据,从而通过 协议解释并获取这
些数据同时强调数据的相互关联、相互联系以及有益于人际理解的语境信息。在目前的具
体实践中,数据往往以 文件的形式发布到互联网络上,存储在关联数据知识库中。而
大多数需要使用这些关联数据的网站可以直接从在线关联数据知识库的数据接口获取
文件并提取其中的相关信息反馈给用户,从而实现信息和数据的跨网站共享。从上面不难
看出,在线关联数据知识库在当前的关联数据语义网构想中占据着核心位置。
就是这样一个在线关联数据知识库项目。它从维基百科的词条中抽取结构化数
据,以提供更准确和直接的维基百科搜索,并在其他数据集和维基百科之间创建连接,并
进一步将这些数据以关联数据的形式发布到互联网上,提供给需要这些关联数据的在线网
络应用、社交网站或者其他在线关联数据知识库。同时,与一些同时期的关联数据知识库
项目不同, 提供的关联数据知识内容并不受限于某一较小的专业或学科领域,到
年为止, 知识库项目已有超过 个条目,这些条目涉及人名、地名、
音乐专辑、电影、组织、种族等等多个类目。在大数量和宽范围的前提下, 知识
库的条目组织就成为决定其运行效率的关键因素。 知识库以构建本体的形式对条
目进行组织,起到了一定的效果。
本体一词是指对客观世界存在的事物的系统描述,在信息科学的领域中, 年
等人最早给出的定义是:给出构成相关领域词汇的基本术语和关系,以及利用这些
术语和关系构成,规定这些词汇外延规则。 年 !"# 将其定义表述为“概念模型的明
确的规范说明”。$ 年 %& 进一步完善了该本体的定义,表述为“共享概念模型的形式化
规范说明”,增加了“共享”和“形式化”两个限定语。 年 '&" 等人在对 !"# 和 %&
的定义进行了深入研究后,将本体进一步表述为“共享概念模型的明确的形式化规范说明”
并从此形成了目前信息学界对本体概念比较一致的看法。
本文以 的本体结构为实例,从类与条目属性以及本体结构两个方面,分析
本体的构建思路。
2. DBpedia 本体的类和条目属性分析
如前所述,本体是对共享概念模型的明确的形式化规范说明。根据斯坦福大学医学院
发本体的构建七步法,构建本体有如下七个步骤:
() 确定本体的专业领域与范畴
() 考察复用现有本体的可能性
() 列出本体中的重要术语
() 定义类和类的等级关系
(() 定义类的属性
() 定义属性的分面
($) 创建实例
但以上所述的七步法仅适用于某一专业或学科领域本体的构建。在 知识库一例
中,由于所需要构建本体的是维基百科条目,因此其专业领域与范畴无法简单确定,因此
在 的本体构建中,采用了类似于以叙词表为基础的自动化本体转换的方式。
但同样的,维基百科的词条表并非规范的叙词表,其类目划分也无法简单归于某一专
业分类之下,词语的专指度不可避免的出现不足,因此,在 的本体构建中,类目
划分和定义基本是人工完成,之后的条目转换才使用了自动转换的方式。
2.1 DBpedia 类共有属性分析
本体的体系结构主要包括 个要素:核心元素集、元素间的交互作用以及这些元素到
规范语义间的映射关系。对于本体的一般构造过程,可以用以下公式进行表示:
本体
=
概念(
Concept
)
+
属性(
Property
)
+
公理(
Axiom
)
+
取值(
Value
)
+
名义(
Nominal
)
从以上的一般公式中,我们还可以归纳出本体当中的基本关系类型,共有四类:
() &%) 关系,表达概念之间部分和整体的关系
() *%) 关系,表达概念之间的集成关系
() &%) 关系,表达概念的实例和概念之间的关系
() +#"&%) 关系,表达某个概念是另一个概念的属性
由于 知识库的本体从分类上属于知识本体,因此在类和条目的属性设置上需
要体现以上四种关系。
如图 所示, 的类除了名称这一唯一标示之外,还有如下共有属性:
图 类属性实例
() , 属性,类型是类与条目的根本性区分,以图中‘-./这个类为例,它的类
型属性值是‘0-/,而该类下属的具体电影条目的属性则是‘-./。
() &,%) 属性,这一属性列出了该类下属的所有条目
() '"#-1) 属性,这一属性表明该类的上级类
() '"#-1) 属性,这一属性表明该类的下级类
(() '. 属性,这一属性值指向一个 ,其中说明了所有跟该类同义的词语
以上是 本体类的五个共有属性,从该属性定义中可以看出,由于条目数量多,
类目归属复杂, 类的属性定义较为简单。但仍能体现概念之间的关系。此外,由
于名称的复用可能存在,因此 类和条目的属性命名匹配规则都较为严苛。仍以图
中 -. 类为例,当以 2-. 为索引词查找该类时,无法直接得到反馈结果。由于 的
使用用户生成内容较为随意,在创建本体时为类和条目添加了 '. 属性,以反映不同名
称的同一事物。
2.2 DBpedia 条目属性分析
在 本体体系当中,条目与类是两种不同属性的概念。简单的区分而言,
本体体系中的条目相当于一般本体体系中的概念、属性和取值的集合,三者共同
剩余11页未读,继续阅读
资源评论
baidu_29441713
- 粉丝: 1
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Screenshot_20240427_031602.jpg
- 网页PDF_2024年04月26日 23-46-14_QQ浏览器网页保存_QQ浏览器转格式(6).docx
- 直接插入排序,冒泡排序,直接选择排序.zip
- 在排序2的基础上,再次对快排进行优化,其次增加快排非递归,归并排序,归并排序非递归版.zip
- 实现了7种排序算法.三种复杂度排序.三种nlogn复杂度排序(堆排序,归并排序,快速排序)一种线性复杂度的排序.zip
- 冒泡排序 直接选择排序 直接插入排序 随机快速排序 归并排序 堆排序.zip
- 课设-内部排序算法比较 包括冒泡排序、直接插入排序、简单选择排序、快速排序、希尔排序、归并排序和堆排序.zip
- Python排序算法.zip
- C语言实现直接插入排序、希尔排序、选择排序、冒泡排序、堆排序、快速排序、归并排序、计数排序,并带图详解.zip
- 常用工具集参考用于图像等数据处理
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功