没有合适的资源?快使用搜索试试~ 我知道了~
基于RDF三元组的微博数据格式化存储方法毕业设计论文(1).doc
0 下载量 103 浏览量
2023-07-07
13:05:42
上传
评论
收藏 5.86MB DOC 举报
温馨提示
试读
58页
基于RDF三元组的微博数据格式化存储方法毕业设计论文(1).doc
资源推荐
资源详情
资源评论
计算机科学与技术学院
毕业设计(论文)
论文题目
基于 RDF 三元组的微博数据格式化存储方法
指导教师
职 称
博士讲师
学生姓名
学 号
专 业
网络工程
班 级
系 主 任
院 长
起止时间
目 录
摘要 ..........................................................i
Abstract.......................................................ii
引言 ..........................................................1
第一章 微博数据获取 .............................................2
1.1 新浪微博开放平台 .........................................2
1.1.1 简介 ................................................2
1.2 微博数据获取.............................................2
1.2.1 微博数据获取流程图 .....................................2
1.2.2 应用的创建 ...........................................3
1.2.3 下载软件开发包(SDK) ...................................4
1.2.4 获取微博数据 ..........................................5
1.3 本章小结 ................................................9
第二章 微博数据转换 ............................................10
2.1 微博数据分析 ............................................10
2.2 微博数据转换 ............................................11
2.2.1 RDF 简介 ............................................11
2.2.2 微博数据转换的实现 ....................................12
2.3 本章小结 ...............................................20
第三章 微博 RDF 数据的存储及查询 ..................................21
3.1 Openlink Virtuoso 数据库 ..................................21
3.1.1 Virtuoso 数据库简介 ....................................21
3.1.2 Virtuoso 数据库的安装及使用 ..............................21
3.2 微博 RDF 数据的存储.......................................22
3.3 微博 RDF 数据的查询.......................................23
3.3.1 SPARQL 查询语言简介 ....................................23
3.3.2 微博数据查询 .........................................23
3.4 本章小结 ...............................................29
第四章 总结与展望 ..............................................30
4.1 总结...................................................30
4.2 展望...................................................30
参考文献......................................................31
谢辞 .........................................................33
附录 .........................................................34
i
基于 RDF 三元组的微博数据格式化存储方法
摘要:语义网为 Web 上日益增长的大数据提供了有效的智能化处理手段,它使用资
源描述框架(Resource Description Framework,RDF)来描述网络数据。本文通过
对新浪微博上较为杂乱的微博数据进行分析,根据 RDF 三元组规则,为其中所需有
用信息数据添加语义,并以 XML 为语法,编写算法将其转换为 RDF 文件;此外,研究
了 RDF 数据库 Virtuoso 的使用方法,并将微博的 RDF 数据导入 Virtuoso,使用
SPARQL 语言对其进行快速查询和验证。总之,本文为微博数据的语义转换提供了借
鉴,对于提高网络资源的检索效率具有重要意义。
关 键 词 : 数 据 ; R D F;三元组;存储
ii
RDF-Formatted Data Storage Method for Weibo
Abstract: Semantic Web provides an effective measure of intelligent processing for the
growing big data on the Web,which uses the Resource Description Framework(RDF) to
description the network data.This article through to make an analysis of the messy
Weibo’s data,and to add semantics for the needed and useful data by the rules of RDF
triples, then, write algorithms to convert it to RDF file by the grammar of the XML, in
addition, studied the use of RDF database Virtuoso and import the RDF file of Weibo’s
data into Virtuoso,using SPARQL language for its fast query and validated. All in all, this
article provides reference for the Weibo data semantic conversion, and has great
significance for improvig the retrieval efficiency of the network resources.
Key words:data, RDF, triples, storage
剩余57页未读,继续阅读
资源评论
matlab大师
- 粉丝: 2436
- 资源: 9万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功