论文研究-集成FCM与信息融合的粗粒度级信息的挖掘算法.pdf

所需积分/C币:9 2019-09-08 00:53:47 466KB .PDF
1
收藏 收藏
举报

如何获取粗粒度级信息是信息管理与信息系统中的研究热点之一。提出一种基于模糊认知图(Fuzzy Cognitive Map,FCM)与信息融合集成挖掘的面向多样例粗粒度信息获取方法,FCM可以建立多细粒度概念与粗粒度概念之间的模糊认知关系,信息融合则用于构建粗粒度级概念的信息表达,NHL(Nonlinear Hebbian Learning)实现了基于数据源的自动学习,从而可以计算出粗粒度级概念的信息值,该方法在Fisher’s Iris公开数据集上分析并验证了有效性,并将此应用于基于科技文献大数据的科技人才评价发现中。
彭珍,彭洁,赵伟,等:集成FCM与信息融合的粗粒度级信息的挖掘算法 2014,50(23) 为了避免积分的计算,文章提出是使用累积逻辑分布细粒度级概念,每个数据都有一个类别 (双曲正切函数tanh(y).B=1,近似累积正态分布),见 根据基于NHL的FCM粒度级信息挖掘算法,采用 公式(5)。 C+语言编写程序,FCM的初始矩阵为随札值,获得了 f(x)= (5)每个鸢尾花的信息值(粗粒度信息),据此可以对鸢尾花 进行分类,结朱与实际鸢尾花的类别号完全相符 根据非线性 Hebbian学习的原理,用于粗粒度级信 通过在其中加入了计算吋间与空问的方法,运算结 息挖据的对所有数据的FCM目标概念信息触合值平方果及鸢尾花类别分析如表1所示 的数学期望最大,定义为: 通过实验结果,得到如下结论: maxmize F=[4()] (6) (1)空间占有率基本不变。 根据非线性 Hebbian学习的原理,细粒度级概念对 (2)运行时间越长,循环次数越多。 粗粒度级概念的杈值受‖W=1的限制,定义FCM调节 (3)越小,循环次数越多,运行时间越长,但要小 权值公式为 于0.1。 △w,(t+1)=nA()(A:()-w,(t)A,(t)) (7) 4)n=0.0007时区分度更明显 其中,是一个很小的正标量因子,称为学习速度参数 (5)获得的粗粒度信息值可以实现类标识的区分。 A,(t)是细粒度在步骤t时的信息值。 4.2在基于科技文猷大数据的科技人才评价上 集成FCM与信息融合的面向多实例粗粒度级信息的应用 的NHL挖抛算法,其体步骤如下所示 科技人才评价是促进科技人才资源开发和管理的 步骤1初始化权向量W(O)t=0。 重要于段,保证科技人才质量的关键性工作。中国科学 步骤2读入多样例细粒度级信息值作为初始状态技术信总研究所拥有中国高层次科技人才数据库和 A, (t) 富的科技文献资源。其中包括现有高层次科技人才的 步骤3计算A、()2。 sCI检索的科技文献资源78550条记录,每条记录中有 步骤4t=t+1,对每个样例重复下步骤 作者编码、文章题目、被引频次、影响因子、作者序列、期 刊名称、发表日期、卷页码以及所属领域等;还有Web (1)p=1。 of Knowledge等SCI检索的丰富文献数据。文献中的 (2)根据公式(7)调整针对第p个样例权重矩阵每一项为细粒度级概念,科技人才相当于粗粒度级概 W,(t)2。 念,每一位科技人才发表过很多条文献记录,因此,基于 (3)计算A()2。 科技文献大数据的科技人才评价是一种面向多样例的 (4)选择数学期望最大的,这个权重矩阵W(y作粗粒度级信息的挖据问题。 为t步中最佳W(t) 将集成rCM与信息融合的粗粒度级信息的挖掘应 步骤5转入步骤4直到公式(6)满足为止。 用于科技人才大数据评价发现中,信息融合的公式为 步骤6使用最终的权向量H和细粒度级概念向量式(8),其中t为该文献k的主题相关性,科技人才 通过公式(4)计算得到每个样例的粗粒度信息值。 在第k条文献记录中的排名是r,该科技人才j发表文 献的总量为n,。采用Iris数据集上具有最佳区分度的 4实验及应用 学习因子η=0.0007,结果表明科技人才评价的准确率 41在Iris数据集的实验及分析 达到90.15% 该算法在Iris数据集上进行实验,该数据集以鸢尾 E(4)。1 花的特征为数据源。它包含150条数据,每个数据包含 ∑An 4个独立的属性(萼片、花辦的长度与宽度),可以认为是 下一步,拓展从中国高层次科技人才的科技文献、 表1于NHL的FCM粒度级信息挖掘算法在Iis数据集的实验 两种情况 循环次数 类别 别2 类别3 运行时间/s空间占有率kB 前100条为训练0.07 264 09825,0.98320.9890,0.99020.9915,0.9920115799745 约605 集,后50条为测0.007 [09710,0.9720][09808,0.98291[0.9848,0.9955]24.0516686036 试集 00000150209350934909516,09552】0.9595.09608103468918约6032 前120条为训练00 310、209 0983 约0.990 约0992 约6000 集,后30条为测0.007443、448 0.975 0.983、0.984 0.987 约6028 试集 0.00071557、1612 0.95 约98 约6032 (下转35页)

...展开详情
试读 3P 论文研究-集成FCM与信息融合的粗粒度级信息的挖掘算法.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
抢沙发
一个资源只可评论一次,评论内容不能少于5个字
weixin_38743602 你的留言是对我莫大的支持
2019-09-08
  • 至尊王者

    成功上传501个资源即可获取
关注 私信 TA的资源
上传资源赚积分or赚钱
    最新推荐
    论文研究-集成FCM与信息融合的粗粒度级信息的挖掘算法.pdf 9积分/C币 立即下载
    1/3
    论文研究-集成FCM与信息融合的粗粒度级信息的挖掘算法.pdf第1页

    试读结束, 可继续阅读

    9积分/C币 立即下载 >