没有合适的资源?快使用搜索试试~ 我知道了~
文献知识图谱的设计与实现.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 132 浏览量
2022-11-28
23:20:35
上传
评论
收藏 866KB PDF 举报
温馨提示
试读
28页
...
资源推荐
资源详情
资源评论
文献知识图谱的设计与实现
摘要:随着互联网技术的深入发展,互联网中的数据越来
越呈现出复杂多样的态势。数据结构参差不齐,数据规模爆炸
式增长,数据来源渠道多样,仅通过网页和传统文档万维网已
难以满足人们快速而精准地获取相应信息的需求。在这种时代
背景下,如何从海量的数据规模中精准而快速地提取所需信息,
构建自己的知识体系结构,显得日益重要。知识图谱的概念应
运而生,作为数据爆炸时代实现知识构建、知识管理、知识运
用的重要资源,知识图谱在检索和基于知识进行相关推理推荐
等方面发挥着巨大作用。本文立足于文献知识图谱角度,完成
以下工作:(1)进行数据准备,获取 DBLP 数据,从 CCF 网上抓
取 10 大领域期刊及会议信息,存入 mysql 数据库中;(2)根据已
有数据进行知识图谱数据模型设计,定义本体,定义知识图谱
中类的相关属性及类直接包含的语义关系;(3)利用 python 语言,
制定相应抽取规则,对 DBLP 数据进行相应抽取存入 Neo4j 图
数据中,同时关联 mysql,进行数据融合,将 Neo4j 中数据与
mysql 数据进行匹配,完成知识图谱中,Venue 的领域属性填入;
(4)定义合理的业务逻辑查询,实现该知识图谱相关的查询功能;
(5)利用 Django 进行网站的简单搭建,采用 Ajax 进行前后端数
据交互,最终完成知识图谱的可视化。
关键词:知识图谱;Neo4j;Django;echarts 数据可视化
前言
文献知识,在人们的日常学习研究中,扮演着举足轻重的
角色,它是人们获取知识的重要途径,也是许多重要的研究成
果得以发展的重要基石,在时代高速发展的今天,研究很大程
度上,需要站在巨人的肩膀上。然而,随着大数据时代的到来,
人们无时无刻不被各种各样的信息、知识轰炸,如何从如此巨
量的信息中精准提取所需信息,构建属于自己的知识体系,并
实现其学习研究价值,显得日益重要。
知识图谱的概念应运而生。知识图谱,追溯其本源,是一
种叫做语义网络的知识库,具有有向图结构,实体及概念,由
结点表示,实体(概念)间的关系,则通过图结构中的有向线表示。
从其发展历史来就看,其概念在 2012 年由谷歌(google)正式提
出,旨在从网络网页中抽取各种实体及其属性,实体间关系,
实现更智能的搜索引擎,包括个性化推荐、智能检索及自动问
答等方面,以满足数据快速膨胀的需要。知识图谱的概念一经
提出,自 2013 年始,便得到广泛关注并迅速普及,在谷歌的概
念基础上,知识图谱的概念进一步完善,将其定义为不同种类
信息连接后形成的巨大的关系网络,并对关系网络中的各类信
息进行有序的组织,便于用户进行智能的搜索与管理。知识图
谱在之后的情报分析,反欺诈,智能问答中,发挥重要作用。
本文主要基于 neo4j 的图数据库以及 python 语言,实现文
献知识图谱的数据模型设计,数据存储,相关信息的抓取以及
一定的数据展示。
第一章 绪论
本章介绍了论文的课题背景,并简要介绍了本系统研究课
题的主要内容及做文献知识图谱的意义,最后,在本章介绍了
本论文的组织结构。
1.1 课题背景
文献知识,在人们的日常学习研究中,扮演着举足轻重的
角色,它是人们获取知识的重要途径,也是许多重要的研究成
果得以发展的重要基石,在时代高速发展的今天,研究很大程
度上,需要站在巨人的肩膀上。然而,随着大数据时代的到来,
人们获取信息的渠道越来越多样化,人们无时无刻不被各种各
样的信息、知识轰炸,互联网上爆炸式的海量信息,数据格式
参差不齐,大量音频、视频等非结构化数据存在,仅通过网页
和传统文档万维网已难以满足人们快速而精准地获取相应信息
的需求。并且,异构、动态且多样的数据为数据的存储、检索、
处理、分析等工作带来了巨大挑战。根据国际数据公司的研究
报告,全球数据总量在 2011 年已经高达 1.8ZB,据报告预测,
2020 年,全球数据总量将高达 35ZB,而在这庞大的数据总量
中,大约有百分之 95 的数据因为人们数据分析能力不够高超而
被闲置[1]。如何从如此巨量的信息中精准提取所需信息,构建
属于自己的知识体系,并实现其学习研究价值,显得日益重要。
在此基础上,人们需要迫切需要数据可视化对知识资源及其载
体进行描述,并通过相应的数据分析手段,对知识进行数据挖
掘、分析等工作。知识图谱在这时代背景下,应运而生。
知识图谱,追溯其本源,是一种叫做语义网络的知识库,
具有有向图结构,实体及概念,由结点表示,实体(概念)间的关
系,则通过图结构中的有向线表示。2001 年,语义网络的概念
首次被提出,旨在让机器识别相应结构化信息,因而,我们需
要对各种结构化,非结构化,半结构化数据进行清洗及处理,
以便计算机的识别。2012 年,Google 首次正式提出知识图谱
(Knowledge graph,KG),将其搜索结果加入知识图谱中,该项目
定义为,通过一些简单的关键字,从网络网页中抽取各种实体
及其属性,实体间关系,实现更智能的搜索引擎,包括个性化
推荐、智能检索及自动问答等方面,从而识别出与之相关的一
整套知识体系。
知识图谱目前已广泛运用于各种领域。作为大数据的应用
产物,知识图谱与大数据相结合,继而形成更多运用。例如:
构建学科知识图谱,基于 DFA-NFA 结构构建正则表达式的多
模式匹配算法;运用于社交网络, facebook、twitter 等,建立相
应的社交关系网络;运用于各种特定行业:医疗行业,地产行业
等,形成专业性较强的知识体系。
1.2 课题内容及意义
l 课题内容:
本次课题的目的旨在构建文献知识图谱,进行知识图谱的
设计以及相应的实现。获取 DBLP 文献知识,同时从网页抓取
出版地所属的学科领域,以完成知识获取过程;根据未来不同的
查询需求,对已有数据进行解析,构建本体,基于本体完成知
识图谱数据模型的设计;将网页抓取数据存储到 Mysql 中,再将
两部分数据进行融合,并存储于 Neo4j 数据库内;利用 Django 搭
建简易网站,在后端进行数据查询的相关逻辑处理,采用
Jquery(Ajax)进行前后端数据交互,利用 echarts 最终实现文献图
谱的数据可视化。
l 课题意义:
文献是人类认识及改造社会过程中的知识积累,是人类知
识的载体,也是人们获取知识、信息的重要来源。而知识图谱
从本质上来看,可以看成是一个具有网状结构的知识库,能够
将一系列分散的实体通过一定的关系建立相应的关联。它是一
种对现实世界的逻辑符号表达,使得计算机得以站在关系角度
去对实体关系进行分析。知识图谱改变了人们传统的数据检索
方式,不仅仅停留在字符串模糊匹配检索的层面,它能够从语
义角度理解用户真正的查询需求,实现了通过推理进行检索;同
时,知识图谱能够将结构化的数据查询结果以可视化的卡片形
式向用户展示,使得用户对查询结果数据有更加清晰、全面的
认识。
建立文献知识图谱,将原有的离散的数据进行整合,存于
一张图谱中,有助于用户摆脱传统的查询方式,实现更好的检
索,根据不同的查询需求,从不同的维度进行精准查询;同时在
剩余27页未读,继续阅读
资源评论
xxpr_ybgg
- 粉丝: 6560
- 资源: 3万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 数据库管理工具:dbeaver-ce-23.2.2-stable.x86-64.rpm
- 数据库管理工具:dbeaver-ce-23.2.2-macos-x86-64.dmg
- 数据库管理工具:dbeaver-ce-23.2.2-macos-aarch64.dmg
- 数据库管理工具:dbeaver-ce-23.1.5-stable.x86-64.rpm
- 以下是一些适用于英语六级作文的万能句型模板,涵盖了引言、正文和结论部分的各类表达方式.docx
- MATLAB中的非线性规划
- 进行C语言面试资格确认是招聘过程中一个重要的步骤,目的是确保候选人具备足够的C语言编程能力和知识.docx
- Java 轻量级的集群负载均衡设计
- 纹身师个人网站模板.jpg
- 在C语言中,连接两个字符串(即将一个字符串附加到另一个字符串的末尾)通常可以使用标准库中的 `strcat` 函数.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功