论文研究-基于云计算及E-Science的科研社区系统 .pdf

所需积分/C币:9 2019-08-15 10:46:00 544KB .PDF
6
收藏 收藏
举报

基于云计算及E-Science的科研社区系统,任鹏杰,郭磊,当前,科研人员在科研工作中所需管理的资源越来越多,科研日趋复杂,团体协作愈发重要。如何有效的管理大量的资源,提高科研及协
国武技论文在线 设计符合现有系统的架构模式。对于每层来说,低层是透明的。基础坏境层提供了系统执 行的环境,如果是基于技术米实现,那么该层就是 。在线 操作系统层是关键的一层,它可以提供统一的调用接口(比如提供本地文件系统和 文件系统读写的统·接口),从而屏蔽本地计算和分布式计算。也就是说对于上层应用来说, 它只要调用相应的接口,至于该接口是由本地设备还是云中的设备来提供服务是透明的。而 且,在线探作系统层可以大大提高代码的可重用性和可维护性,保证不同的应用具有系统的 计算实现。此外,在线揀作系统层的存在大大提高了系统的可扩展性,我们可以很容易地基 于该层接口扩展一个新的应用程序而不必关心现有应用程序的实现。最后一层是应用系统 层,主要包括四个组成模块,包括:资源管理( )、文献管理( )、社区管理( )、个性化检索及推荐( )。这四个模块基本包括了口常科研的全部功能,可以满足整个科研团 队或单个科硏用户的科硏活动需求,另一方面,应用程序也要向外提供规范接凵,供其他新 加应用程序的调用。系统在实现过程中同时兼顾工程的三层架构思想,与本文的架 构思想相结合,致力于实现清晰、高效、合理的架构设计。 该系统的特点就是基于的方式实现用户的科研活动。用户可以随时、随地通过计 算杋、平板、智能手杋等各种接入终端登录科硏社区,进行相应的科研活动。而且我们提供 了普适性的系统架构及通用接口,其它更多的应用可以基于操作系统层接口和基础应用接口 来进行敏捷开发 个性化论文推荐 当前文献数量激増、更新迅速,科硏工作者很难及时、滩确的获得自己需要的文献。因 此,我们将首先根据用户已发表的论文及其合著者的关系构建一个合著者关系网络,主要包 括三个核心要素:()用户之间的合著论文关系:用户通过与其他用户之间合著论文建立 关系。()论文之间的关联关系,如只有共同的作者和相似的内容。()用户对论文的评 分信息:每个用户都可以对自凵所喜欢的论文进行收减,通过这种隐式的反馈信息、(收减即 为,否则为),来表达自u对论文的喜好。基于此,进行用户兴趣建模及论文推荐 图推荐算法的概率图模型 在现实社会中,我们总是倾向于选择朋友为我们的推荐,对于相似的物品给予相近的评 分。基于对以上现象的观察,为了能在算法中反映出社区化推荐的过程,充分利用这三种不 同类型的数据资源(用户间的合著关系、论文间的关联关系和用户对论文评分信息),我们 将这三部分信息通过潜在的特征空间进行关联,并提出了一种基于用户社区的概率矩阵分解 国武技论文在线 算法。该算法的基本思想就是希望从用户历史袢分模式和合著关系网络中,推导出能表示用 户和论文的低维潜在特征,并进而为目标用户提供准确的推荐。算法所对应的概率图模型如 图所示 假设用户的评分矩阵P中有m个用户,篇论文,其中r;∈{0,1}表示用户u;对论义的 评分。用户间的合著关系风络用图g=(,8)示,其中l={t}理1表示用户的集合,E′ 表示用户问的合者关系。用户间相似矩阵用D={d1;}表示,对」任意一对用户u;和2,来说, dy∈(0,1表示会在大多程度上受影响。论文间的关联关系用图g*=(,8“)表示,其中 ={v}1表示论文的集合,E表示论文间的关联关系。论文间的相似矩阵用S={s;}表 示,对于任意两篇论文v和v;米说,s;∈(0,1表示v和l之间关系的紧密程度。在算法中, 我们使用节点在图上的距离来衣示用户或论文之间关系的紧密程度 我们用U∈Rxm和V∈Rx分别表示对评分矩阵R分解得到的与用广和论文相关的 维特征矩阵,其列向量U和则分别表示相对应的潜在特征向量。这样,评分矩阵R的条件 概率分布可以定义为 P(RU, VoR)=III(rig(U;V),R) 其中,N(x1,02)表示?服从均值为p,方差为的高斯分布,是指示函数,它表示 如果用户;对推荐对象u进行了评分,它的值就等于,否则为。函数g(x表示逻辑函数 (x)=1/(1+ex(-x),使用它的目的是将预测值(Uv)限定在区间之内。我们假设 U和V服从均值为的球形高斯先验 1l-IM(,),p叫)-N10呢 我们用∈Rxm和Q∈Rxm表示对用户间的相似矩阵D分解之后的因子特祉矩阵,列 向量U和Qk分别表示其相对应的潜在特征向量。用户间相似矩阵的条件概率分布可以定 义为: (DIU, Q, 0D)=lI(dik g(UTQ:), of 1k=1 其中是指示函数,它表示当用户之间存在直接的合著关系时,其值取,否则为。 我们假设Q也服从均值为的球形高斯先验分布: 我们用V∈Rx和W∈Rxm表示对论文间的关联关系矩阵S进行分解得到的两个表示 论文重要特征的维潜在特征矩阵,其列向量V和W则表示相应的特征向量。我们定义论文 间关联关系矩阵S的后验概率分布为 SIW,V,0s)=Iw(stig(W!1i),03) t=1j=1 其中,指示函数1表示如果论文v和在图G+有直接的联系,其值为,否则为。我们 假设VW服从均值为的球形高斯先验分布: 国武技论文在线 在算法中,我们通过共享的特征空问和V将论文间的关联信息、用户间的合著网络和 评分信息结合在一起(如图所示)。我们可以进一步得到,V,W,Q的对数联合后验概率分 布: Inp(U,V,W, QIR, D, S, on, aD, 03, ou, av,aw,oo) dik-g(U Qk) 1k=1 ∑∑l(s-90W1Y)2-m∑ ∑V l Q: QR ∑∑ 2(∑∑加+②∑血) t=1j=1 S(mlInoi +nllnoi +mlIno?+nl Ino)+C, 其中C是不依赖于参薮的常量。求参薮固定时U,V,W,Q的极大后验概率,相当于在以下带 二次止则项的目标函数中最小化误差平方和 m n E(RD.VQ)=2∑∑增(-9()2 +2∑∑=9Q)2 i=1=1 +2∑∑-9(WV)2 t=1=1 UB+2v+21(-a21Wl, 其中,AD=o OR/oD, As=oR/os, Au=r/oz, Av=or/ 范数。对于公式()表示的目标函数,我们通过在W, ¢,U和Ⅴ上使用梯度卜降的方法进行求解,使目标函数能达到局音极小值: OE aWt ∑(WV9(W:)-5V+AW OE aQ/ ∑19(!Q9(2Q)-dk+AQk OE O 0( +入D∑1RUQ(9(U:Q)-4线1k+ k=1 ∑gUV)9(UV)-r3)U2 +As>I9(wV)(g(wV)-stilt+ Xyv 其中g(x)=exp(x)/(1+exp(x)2是回归函数g(x)的导数。 国武技论文在线 通过以上过程,我们使用户的兴趣特征向量尽可能的与其合著的用户相接近,使论文的 特征向量尽可能的与其相似的论文相接近,从而反映出基于合著网络中的团队用户米为用户 推荐论文的具体方法。 系统实现 时寸回分( 图资源管理 资源管理”:用」在线管用户的所有数据资源。其管理模式与 系统的“资 源管理器”基木相同,可以实现基木的资溟操作,如:査看、移动、复制、删除、重命名、 编辑等等。 图社区管理 “社区管理”:实现多个科硏用户之间的交流、资源共享及协同工作。借鉴当前流行的 新浪微博、等软件,实现了科硏用户之间的在线即时交流、论文协作、资源文献共享 等功能。 D中 三三:=元==三 tmes MeA T e 4vo 图文献管理 “文献管炟”:用于在线管理用户的所有相关文献。在参考开源桌面文献管理软件 国武技论文在线 的基础上实觋了基于的文献管理,包括文献的添加、朋除、文件的导入 文献的分组管理等功能 图个性化检索及推荐 “个性化论文推荐”:实现用户的兴趣建模,对木地资源文献、社区共亨文献及 文献的文献等基于用户兴趣推荐。 展望 本文给出了基于云计算和 的科研社区原犁系统的架构设计及实现,包括基础 应用“资源管理”、“社区管理”、“个性化论文推荐”等。在下一步工作中,我们将在系 统使用的可靠性、易用性等方面进行提扃,并投入实际应用。我们还将针对科硏需求提供更 多的实用应用,比如科研数据集成、科硏L具集成等等,并在平台有定的薮据积累后,研 究更髙效的挖掘算法 参考文献 成全基于协冋同标注的科研社区知识合机制研究情报理论与实践 中国科技网科研在线协作平台 王鹏走近云计算北京:人民电出版社, 范新灿张来玉基于 的 的三层结构开发技术研究与实现计算机与现代化 ()

...展开详情
试读 7P 论文研究-基于云计算及E-Science的科研社区系统 .pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
一个资源只可评论一次,评论内容不能少于5个字
weixin_39841848 如果觉得有用,不妨留言支持一下
2019-08-15
您会向同学/朋友/同事推荐我们的CSDN下载吗?
谢谢参与!您的真实评价是我们改进的动力~
  • 至尊王者

    成功上传501个资源即可获取
关注 私信
上传资源赚积分or赚钱
    最新推荐
    论文研究-基于云计算及E-Science的科研社区系统 .pdf 9积分/C币 立即下载
    1/7
    论文研究-基于云计算及E-Science的科研社区系统 .pdf第1页
    论文研究-基于云计算及E-Science的科研社区系统 .pdf第2页

    试读结束, 可继续读1页

    9积分/C币 立即下载 >