没有合适的资源?快使用搜索试试~ 我知道了~
基于知识图谱技术的线上教学资源推荐系统设计与实现.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 19 浏览量
2022-11-02
17:13:49
上传
评论
收藏 1.43MB DOCX 举报
温馨提示
试读
29页
基于知识图谱技术的线上教学资源推荐系统设计与实现.docx
资源推荐
资源详情
资源评论
引言
当今的时代是信息化飞速发展的时代,与日俱增的海量数据令当代生活陷
入了“乱花渐欲迷人眼”的局面。诚然,互联网上以指数级增长的教学资源为追求
自我提升的学习者带来了许多便利。然而,信息过载、数据爆炸也为学习者查
找可用信息、浏览所需资源带来了挑战。推荐系统作为该问题的核心解决方案
之一,能够向学习者快速高效地提供可用信息。推荐算法主要包括基于内容的
推荐、基于协同过滤的推荐、基于关联规则的推荐等类型。然而,仅使用以上
方法可能会出现冷启动、数据稀疏等问题
[1]
。
这些传统的推荐算法也存在问题和缺点。例如,基于内容的推荐算法主要
根据用户的喜好进行推荐,因此很难为用户带来新鲜有趣的推荐结果,在一定程
度上导致了“信息茧房”的形成。而基于协同过滤的推荐算法普遍存在冷启动和
数据稀疏的问题。此外,传统推荐算法偏重于推荐前 20%信息丰富的物品,系统
中剩余 80%的物品很难展示给用户,导致“长尾效应”,使资源利用率降低。而基
于关联规则的推荐算法对于模型参数的设置要求较高,对于大规模的潜在关系
挖掘不甚擅长,性能不佳。如何有效避免出现信息茧房现象,为学习者提供更多
交叉学科的教学资源推荐,帮助学习者建立知识体系化概念,是教学资源推荐中
的关键问题。
在推荐系统中引入知识图谱(knowledge graph)为解决上述关键问题提供
了可能。
[2]
知识图谱是一种特殊的图结构,包含了丰富的语义知识,可大幅提高推
荐的准确性和可解释性
[3]
。在知识图谱中,知识及其关联构成三元组。多个三元
组通过节点关系相互连结,构成网 状结构,清晰记录了各项目间的关联关系,包
含着丰富的语义关联信息
[4]
。利用知识图谱可以实现对教学资源中多源异构数
据的有效整合,形成包含丰富语义联系的知识网络图。
然而,构建出全学科内包含丰富语义联系的知识网络图是一项具有挑战性
的工作,其难点在于交叉学科知识点及体系化知识点间的语义关联构建。原因
是:(1)若全部 由教师人工构建,则需要全学科领域内众多专业教师的配合。
这不仅会耗费大量的时间和精力,同时也可能因教师的不同理解而出现差异,导
致可信度降低;(2)若全部由系统自动抽取,则需要系统具有极高的文本、图像、
视频等多源异构数据的处理能力,然而现阶段的技术能力暂时难以支持该目标
的实现。因此本文采用基于教师人工构建和系统自动抽取相结合的方法,在知
识图谱结构中增加了“标签”的实体用于连接全学科内知识点,实现交叉学科知识
点的语义关联构建。同时增加了“系列”的实体,用于连接语义上相互补充的知识
点集群,实现体系化知识点语义构建。
全学科内知识网络图构建完成后,由于其涵盖范围广、节点及语义关系复
杂、学习者专业背景差异大,如何给用户推荐出合适的学习路径,为其建立完整
的认知地图,从而最大化地覆盖全学科的知识网络图,成为本文推荐策略最大的
挑战。本文提出了基于图嵌入和规则抽取融合的方法,并通过实验结果分析,验
证了该方法能够有效缓解传统推荐系统的“长尾效应”。此外,本文还使用多种呈
现方式实现了推荐结果的可视化,为用户创造良好的使用体验。
本文的主要工作为:
(1)基于教师人工构建和系统自动抽取相结合的方法,依靠知识图谱结构
中“标签”和“系列”实体,解决了其中交叉学科知识点和体系化知识点间的语义关
联构建问题。
(2)本文提出三种推荐策略,分别对教学资源做学习路径推荐、相似知识
点推荐和前后置知识点推荐。它们相互补充,针对性地解决教学资源推荐中出
现的“信息茧房”、交叉学科推荐和体系化推荐问题。
(3)本文实现了融合三种策略的推荐系统,通过实验验证了其在缓解“长尾
效应”方面的有效性。并通过可视化案例说明其实用性。
本文整体结构如下:第一章节介绍了知识图谱数据库、知识图谱推荐系统、
图嵌入模型的相关工作。第二章节概述了推荐系统的整体架构。第三章节介绍
了线上教学资源知识图谱数据库的构建思路。第四章节论述了推荐系统中包含
的三种推荐策略。第五章节展示了推荐系统的实现过程及实验效果。第六章节
对本文进行了总结,并展望了下一步工作。
1 相关工作
本章介绍了知识图谱推荐系统中应用的相关技术。
1.1 知识图谱数据库
知识图谱是一种特殊的图结构。具体来说,它是一种带标记的有向属性图,
图中各节点具有若干个属性,实体之间的边描述节点间的关系,边的指向标识关
系的方向,而边上的标记表示了关系的类型
[5]
。采用了人类易于识别的字符串来
标识各元素;同时,图数据结构作为通用的数据表示方法,也易于被计算机识别和
处理。它的节点对应现实中的实体或者概念,边或属性对应现实中的一条知识
[6]
。在此之上,可以根据人类定义的规则,推导出知识图谱数据中没有明确给出的
知识
[7]
。知识图谱分为通用知识图谱和领域知识图谱。通用知识图谱覆盖面广,
其内部通常包含众多实体与关系,更强调广度、大众化,常应用在科普类、搜索
类、常识类场景内
[8]
。领域知识图谱是特定领域内的知识图谱,是对某领域分析
后制定的图谱,因此领域知识图谱的质量较高
[9]
。本文所构建的知识图谱属于教
学领域内知识图谱。
知识图谱的存储方式分为:基于表结构的存储和基于图结构的存储。基于
表结构的存储主要以三元组形式存储数据,其特点是易于发布,多用于学术场景。
基于图结构的存储方式以图来表达现实世界的关系,直接、自然,易于建模,能够
高效插入大量数据或查询关联数据,对于图的遍历效率极高,多用于工业场景
[10]
。
本文应用场景要求频繁更新图结构,且需要较高的图遍历效率,因此选用基于图
结构存储方式的数据库 Neo4j。在各类图数据库的知名度及使用率上,Neo4j 均
排名第一
[11]
,具有优秀的大规模数据查询性能,灵活的非结构化数据存储方式,且
支持可视化界面。当前主流图数据库特点对比见图 1
[12]
。
图 1
图 1 多种图数据库性综合评分对比
图片来源: https://db-engines.com/en/ranking_trend/graph+dbms
Fig.1 Comprehensive score comparison of various graph databases
1.2 知识图谱推荐系 统
基 于 知 识 图 谱 的 推 荐 方 法 可 以 分 为 如 下 类 别 : 基 于 嵌 入 的 推 荐
(recommendation based on embedding)、基于连接的推荐(recommendation
based on connection) 和 基 于 混 合 的 推 荐 (recommendation based on
hybrid)
[13]
。各类方法及其详细信息如表 1 所示。
表 1 知识图谱推荐系统方法对比
Table 1 Comparison of knowledge graph recommendation system
methods
分类
代表模型
特点
基于连接
的推荐
HeteroMF
SemRec
FMG
GraphLF
高效率,可解释,但需手动设计元路
径,信息高度依赖于连接模式
基于嵌入
的推荐
TransE
TransH
TransR
DistMult
将实体与关系映射为低维向量后进
一步计算
基于混合
推荐
RippleNet KGCN(Knowledge Graph
Convolutional Networks)
KGAT(Knowledge Graph Attention
Network)
利用低维向量的计算挖掘图谱中的
多跳关系
新窗口打开| 下载 CSV
其中,基于连接的方法需要专家意见及人工设计
[14]
,由于本文场景暂不具备
此类条件,因此这一方法不适用。基于混合的推荐虽然在一定程度上解决了基
于连接的方法与基于嵌入的方法的缺陷,但需要大量用户基础数据
[15]
,而本文场
景缺乏海量用户基础数据,因此这一方法也不适用于本文场景。考虑到推荐系
统的可扩展与计算方法的多样化,本文选择了基于嵌入的推荐方式。
1.3 图嵌入模型
图嵌入是指以知识图谱三元组数据为源数据,通过机器学习将知识图谱中
实体和关系表示为稠密的低维实值向量,从而实现了知识图谱的特征学习,使抽
象的知识图谱实体与关系对象变得易于分析计算,缓解了知识图谱数据稀疏的
问题,为链路预测、节点聚类、相似度计算等下游任务提供了有力的素材
[16]
。
近年来,学术界提出了多种图嵌入的建模方法,包括以 RESCAL 为典型代表
的矩阵分解模型,以 LFM 为主要贡献的双线性模型,以 TransE 为基础扩展出的
多种翻译模型等。其中,以 TransE 为基础的图嵌入模型在知识图谱计算的各类
下游任务中取得了优秀的成果
[17]
。然而,随着模型研究的进一步深入,TransE 模
型显示出了其固有缺陷:模型定义过于简单,难以表示复杂关系。随后,又相继
出现了 TransH
[18]
、TransR
[19]
、TransA
[20]
、TransG
[21]
等模型,这些模型在处理
知识图谱复杂关系时均做出了相应改进
[22]
。2019 年,RotatE 模型作为一种更优
的改进方法出现
[23]
。它沿用了前文所述的图嵌入思想,以欧拉恒等式为灵感来
源,将每个关系定义为复矢量空间内从源实体到目标实体的旋转,从而实现了对
复杂关系(对称、非对称、可逆、复合关系)的建模。
2 系统架构
本文以知识点为核心,设计了一套完整的领域知识图谱,包含知识点、资源、
系列、教师、标签在内的 5 种实体。开发了在线教学资源制作平台,用于教师
制作和维护线上教学资源,实现了知识图谱数据库的自动构建。
在此基础之上,本文设计并实现了线上教学资源推荐系统。包含三种推荐
策 略 : 基 于 教 师 和 标 签 的 关 系 实 现 了 学 习 路 径 推 荐 策 略 ;基 于 图 嵌 入 模 型
RotatE 实现了知识点间的相似推荐策略;基于系列中知识点关系链的组合实现
了前后置知识点推荐策略。系统整体架构图如图 2 所示。
图 2
剩余28页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3576
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 服务器概述服务器概述服务器概述服务器概述.txt
- 华中农业大学python实验题.txt
- 海康威视相机采图交叉编译示例程序,c++
- DETR-基于Tensorflow实现DETR目标检测算法-附流程教程+项目源码-优质项目实战.zip
- 3d激光slam地图发布程序,3d地图点云处理,c++程序
- 送给妈妈的一束鲜花.zip(母亲节祝福HTML源码)
- 稀疏化DETR-基于Pytorch实现稀疏化DETR-SparseDETR-附流程教程+项目源码-优质项目实战.zip
- 人工分类:SLTM的微博评论二分类数据集
- (自适应手机端)响应式房产合同知识产权网站pbootcms模板 企业管理类网站源码下载.zip
- (自适应手机端)响应式动力刀座pbootcms网站模板 五金机械设备类网站源码下载.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功