没有合适的资源?快使用搜索试试~ 我知道了~
人工智能-数据挖掘-基于数据挖掘的图书馆个性化推荐系统研究和应用.pdf
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
5星 · 超过95%的资源 1 下载量 143 浏览量
2022-06-27
19:16:29
上传
评论
收藏 3.37MB PDF 举报
温馨提示
试读
58页
人工智能-数据挖掘-基于数据挖掘的图书馆个性化推荐系统研究和应用.pdf
资源推荐
资源详情
资源评论
第一章绪论
1.1研究背景及意义
第一章绪论
图书馆长久以来一直扮演着人类知识传播的重要角色,“教师是一所学校的
头脑,图书馆是一所学校的心脏”,可见图书馆在教育中的重要性。图书馆是一
个专门收集、整理、保存、传播文献并提供利用的科学、文化、教育和科研机构。
其主要职能有:①保存人类文化遗产:②开展社会教育:③传递科学情报;④开
发智力资源:⑤提供文化娱乐。高等学校图书馆除了上述职能外,尤为突出的
两块功能是支持学科教学和科学研究。优化图书馆资源检索系统、提供图书推荐
服务可以提高图书借阅率,进一步发挥高校图书馆的作用。
上世纪80年代以前图书文献借阅主要依赖卡片进行人工检索、登记,采购
信息、库存信息、读者信息、借阅信息等大量宝贵数据无法用信息化方法记录存
储,更谈不上图书文献借阅统计、读者借阅模式分析和图书文献关联性分析,而
且图书馆缺乏有效的方法把图书文献信息推荐给读者,对读者的借阅兴趣产生了
抑制。1979年美国匹兹堡大学曾做过调查,调查报告显示,图书馆的馆藏资源
只有少数被有效利用。原因之一就是图书馆和使用者之间的互动不足。往往图书
馆扮演被动的角色,无法主动提供信息给使用者。
随着信息技术和网络技术的发展,80年代图书馆迎来革命性的变化——图
书馆自动化信息管理技术。其显著特点是图书馆联机网络进一步发展并与图书馆
界先后建立的自动化集成管理系统联成一体n1。处于自动化管理阶段的图书馆普
遍采用计算机和自动化集成管理系统辅助采购、编目、流通、检索、内部管理等
业务,而且建立了机读目录数据库和二次文献检索数据库。用户可以通过图书馆
联机公共检索目录和联机信息检索系统乜3查询书目。
以数据库技术和网络技术为核心的“图书馆自动化信息管理系统”,存在着
自身的不足。自动化技术可以高效地实现本地或远程数据的录入、修改、统计、
查询等功能,但无法发现数据中存在的关系和规则;无法根据现有的数据预测未
基于数据挖掘的图书馆个性化推荐系统研究和应用
来的发展趋势。伴随图书文献库存量的增加,图书馆中电子信息的丰富,读者要
准确找到自己需要的信息只能依赖检索工具,这好比在知识的海洋里淘金,检索
需要花费的时间越来越多。为了促进图书馆的健康发展、吸引读者借阅、提高借
阅率,图书馆系统需要分析读者、图书文献及流通历史记录,找出其中隐藏的关
系和规律,根据不同的读者特点提供相应的服务和推荐信息,这就是图书馆管理
系统中的重要分支——个性化推荐系统口一,。
个性化推荐研究直到20世纪90年代才作为一个独立的概念提出。有了这个
技术,图书馆不再是被动的、静态的资源库,而是成为主动参与者。在一个实际
的推荐系统中需要的图书文献可能会有成千上万,用户的数目也会非常巨大,准
确、高效的推荐系统可以挖掘用户潜在借阅倾向,为众多的用户提供个性化服务。
美国图书馆与信息技术联合会(LITA)的10位数字图书馆专家与信息技术领
域专家在1999年的讨论会上,把个性化定制服务列为数字图书馆发展的七大趋
势之首,可见其重要性。该服务在国外一些大学的数字图书馆中已有实现和广泛
的应用,最为典型的是MyLibrary。国内的万方、CNKI等电子期刊网上也有相应
的应用,但目前国内的高校图书馆在个性化推荐方面的应用并不普遍。
目前数据挖掘工具有很多,如SPSS、SSAS、Business
Miner、Knowledge
SEEKER、DB
Miner等,但专用的图书馆数据挖掘系统却很少。通过对图书馆操
作数据清理、数据集成、数据选择、数据变换得到数据仓库,在此基础上构建数
据挖掘模块将对图书馆产生积极意义:一方面可以为管理者提供决策支持;另一
方面可以为使用者提供更有效快捷的服务。
1.2研究现状
1.2.1个性化推荐技术的研究现状
推荐方法是个性化推荐系统中最为核心和关键的部分,它在很大程度上决定
了推荐系统的性能。目前,主要的推荐方法包括:协同过滤推荐、基于内容推荐、
基于关联规则推荐、基于效用推荐等。
1.协同过滤推荐
协同过滤推荐啼1是推荐系统中应用最早和最为成功的技术之一。其核心思想
可以分为两部分:首先提取用户的历史信息,按照用户喜好计算用户之间的距离,
.2.
第一章绪论
然后根据与目标用户最邻近的用户对图书评价的加权评价值来预测目标用户对
特定图书的喜好程度,系统再根据该喜好的程度来对目标用户进行图书推荐。协
同过滤推荐技术最大的优点是对推荐对象没有特别的要求,能够处理复杂的非结
构化对象。
协同过滤推荐系统基于如下假设:与目标用户有着相似喜好的其他用户所感
兴趣的图书内容一定也是该目标用户感兴趣的。所以先找到与目标用户喜好接近
的其它用户,然后将他们感兴趣的内容推荐给目标用户。
基于协同过滤的推荐系统从用户的角度自动的进行推荐。即用户不需要努力
地通过一些行为,如填写一些调查表格等,来找到适合自己兴趣的推荐信,用户
得到的推荐信息是系统从借阅模式、浏览行为等方面隐式获取的。
协同过滤系统是目前应用最为广泛的个性化推荐系统,比较典型的有Grundy
系统№1、Tapestry邮件处理系统订1、GroupLens群集推荐系统㈣、Amazon.corn的
书籍推荐系统∞1、Phoaks的www信息推荐系统n∞等。
2.基于内容推荐
基于内容的推荐n妇(Content—based
Recommendation)是信息过滤技术的延
续与发展。它是建立在项目(图书文献)的内容信息上做出推荐的,不需要依据用
户对项目的评价意见。在基于内容推荐系统中,通过用户已经选择的项目内容信
息计算用户之间的相似性需要借助机器学习的方法从浏览过的项目中建立或更
新用户配置文件,通过检查用户配置文件与馆藏项目配置文件的相似度推荐最相
似的图书文献。
基于内容推荐的系统有Personal
WebWatchern
2J、SiteSeern31、Letizia‘141、
WebPersonal
izern51等。
3.基于关联规则推荐
基于关联规则推荐(Association
Rule-based
Recommendation)是以关联规
则为基础,把已借图书文献列表作为形式参数,规则作为函数,返回值为推荐所
得到的图书文献列表。关联规则挖掘源于零售业,它可以发现不同商品在销售过
程中的相关性。关联规则算法的第一步也是最为耗时的一步就是查找频繁项集,
但该步骤可以离线进行。
4.其它推荐技术
还有其它一些推荐技术,如:基于效用推荐、基于知识推荐、基于网络结构
基于数据挖掘的图书馆个性化推荐系统研究和应用
的推荐、基于二部分图资源分配的推荐等。这些技术的研究都日趋成熟,在具体
应用中应综合考虑系统的需求、系统的对象等特性选择合适的推荐技术。
1.2.2国内外图书馆个性化信息服务应用现状
下面从系统结构和提供的服务方面对国内外若干个图书馆个性化信息服务
应用系统进行对比分析,并对本论文的研究指明方向。
1.国外发展概况
美国康奈尔大学图书馆早在1998年就开发了网络个性化服务平台
MyLibrary@cornell系统,该系统于1999年投入使用。Mylibrary@cornel
l系统
共有五个组成部分:个性化链接子模块(MyLinks)、个性化更新子模块
(MyUpdates)、个性化内容子模块(MyContents)、个性化目录子模块(MyCatalog)
以及个性化文献传递子模块(My
Document
De
l i
very)。图书馆用户可以通过个性
化链接(MyLinks)管理自己经常使用的电子资源,可以像在浏览器收藏夹一样
将资源收藏在MyLinks里面。个性化更新(MyUpdates)每周会向图书馆用户提
供与兴趣相匹配的期刊、书籍、媒体通告等。各种满足用户需求的资源会主动持
续地找到对应的用户,用户再也不用为了查找最新的资料而花费大量的时间。个
性化内容(MyContents)是康奈尔大学图书馆于2002年8月推出的,它通过E—mail
向用户推送期刊,是一种个性化主动信息服务,该模块也是书馆个性化服务系统
的第三个组成部分。
北卡罗莱纳州立大学的MyLibrary@NCState系统也是比较有代表性的个性
化服务平台。MyLibrary@NCState的用户包括本科生、研究生、教师、科研人员
以及社团合作者。主要服务项目有:我的图书馆员;图书馆链接;校园链接:快
速检索;服务定制;书目数据库;电子期刊;即时消息。
随着以上两所较早开发个性化服务系统的大学,美国华盛顿大学、加州数字
图书馆、加拿大的多伦多大学图书馆、新加坡国立图书馆等都相继开发了自己的
个性化服务系统n
6|。
2.国内发展概况
国内的个性化服务系统起步稍晚,现在投入使用的还比较少。其中中国科学
院国家科学数字图书馆建立的“我的数字图书馆——基于个性化集成定制的门户
网站”系统、浙江大学开发的“我的图书馆”系统及深圳市图书馆开发的“ILASIl
第一章绪论
图书馆自动化系统捆绑的个性化服务子系统"是比较成熟且有一定代表性的。
其中中国科学院的国家科学数字图书馆向用户提供针对虚拟资源的个性化
定制功能。其主要使用对象为图书馆及其用户,目的是依据用户的专业、爱好等
特征,通过用户定制、系统推荐等功能为用户提供个性化的信息服务。从而有效
减少了用户在使用图书馆资源时所面临的信息过量的困扰。
国内做得比较成熟的还有清华大学灵捷图书馆、中国人民大学数字图书馆
等,其中推送服务做得比较成功是2002年清华大学和清华同方共同主办的中国
知识基础设施工程——CNKI工程。它的TPI系统功能之一就是主动推送服务,
可开展多种类型的推送服务:包括检索型、订阅型以及提示型,通过这些推送服
务,用户不需要登录网站就能获取信息n
71。
1.3本文主要工作
本文主要研究关联规则和聚类分析在图书馆个性化图书推荐系统中的应用,
主要研究工作如下:
1.以某高校图书馆流通数据库为研究对象,构建数据仓库
该高校流通数据库为SQL
Server
2000关系数据库,包含2003年到2009年
的所有读者信息表、文献信息表、流通信息表、篇目信息表、篇目全文表、篇目
作者表等二十几张表。研究及软件开发过程中,主要分析项目的需求,数据库的
结构,抽取需要的数据集,并对抽取结果进行数据清理、数据集成和变换得到供
挖掘的数据仓库。
2.聚类技术研究和应用
研究了k一均值算法,在项目实现部分根据读者身份、读者专业、年级、借
阅数量等对读者进行聚类处理,得到相应的读者分组。
3.关联规则推荐算法研究及改进
关联规则可以发现不同图书文献在借阅过程中的相关性,也就是读者在借阅
某些图书文献的时候有多大倾向借阅另外一些图书文献。
文本在经典Apriori算法基础上,进行了改进,并对流通数据库抽样作为实
验数据进行了实验验证。
4.实现个性化推荐系统
以SQL
Server
2000作为数据仓库搭建平台,个性化推荐系统使用VC++6.0
剩余57页未读,继续阅读
资源评论
- fwdsjj2023-05-24非常有用的资源,可以直接使用,对我很有用,果断支持!
programyp
- 粉丝: 88
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功