摘要:随着互联网技术的深入发展,互联网中的数据越来
越呈现出复杂多样的态势。数据结构参差不齐,数据规模爆炸
式增长,数据来源渠道多样,仅通过网页和传统文档万维网已
难以满足人们快速而精准地获取相应信息的需求。在这种时代
背景下,如何从海量的数据规模中精准而快速地提取所需信息,
构建自己的知识体系结构,显得日益重要。知识图谱的概念应
运而生,作为数据爆炸时代实现知识构建、知识管理、知识运
用的重要资源,知识图谱在检索和基于知识进行相关推理推荐
等方面发挥着巨大作用。本文立足于文献知识图谱角度,完成
以下工作:(1)进行数据准备,获取 DBLP 数据,从 CCF 网上抓
取 10 大领域期刊及会议信息,存入 mysql 数据库中;(2)根据已
有数据进行知识图谱数据模型设计,定义本体,定义知识图谱
中类的相关属性及类直接包含的语义关系;(3)利用 python 语言,
制定相应抽取规则,对 DBLP 数据进行相应抽取存入 Neo4j 图
数据中,同时关联 mysql,进行数据融合,将 Neo4j 中数据与
mysql 数据进行匹配,完成知识图谱中,Venue 的领域属性填入;
(4)定义合理的业务逻辑查询,实现该知识图谱相关的查询功能;
(5)利用 Django 进行网站的简单搭建,采用 Ajax 进行前后端数
据交互,最终完成知识图谱的可视化。
评论0
最新资源