论文研究-基于领域知识的贝叶斯网络结构学习算法.pdf

所需积分/C币:9 2019-09-08 02:58:52 605KB .PDF
收藏 收藏
举报

针对SEM算法在缺省数据学习中存在精度偏低和收敛速度缓慢的问题,通过将领域知识引入到SEM算法中,提出了KB-SEM算法,该算法首先用D-S证据理论综合领域知识,然后将采集的知识以禁忌表的方式嵌入SEM中来限制和引导算法的搜索路径,缩小算法的搜索空间。实验表明,KB-SEM算法能有效地提高算法的学习精度和时间性能,且能在一定程度上避免主观偏见和数据噪音的干扰。
362008,44(16) Computer Engineering and Applications计算机工程与应用 识。在这里,请三个专家给出他们对网络最有把握的边作出判统 Windows Xp,CPUP426GHz,内存256M,硬盘80G。实验 断并给出信度,然后用D-S证据理论对证据进行合成,从中仅是在系统贝叶斯工具包BNT(作者 Kevin Murphy)下进行的。 选择信度最高(接近1)和最低(=0)两种知识。表1和表2为由 使用 Car diagnosis2网络作为测试网络,该网络有18个 专家给岀的信度最高的4条边,从中,采纳5-7,59两个添节点,20条边。利用概率逻辑抽样算法按数据缺省率5% 加边的信息,和2↑3条件独立的信息,和不可能事件4→3。 10%、15%分别产生样本容量为200和500的模拟训练样本 表1专家信度分配表 用本文提出的KB-SEM算法与SEM算法分别对样本数据进行 5-+7 547549955↑9549 学习。在学习精度和时间性能上,对两个算法进行比较。使用 0.95 0.05 0.900.10 Hamming距离作为结构学习结果与实际网络结构的接近程度, 0.990.010 Hamming距离定义为结果网络和实际网络中不同的边数之和 0.90 0.10 包括没学习到的边数和学到的错误边数。显然, Hamming距离 0.99850 00.00151 0 越小,说明学习结果越接近实际网络。 表2专家信度分配表 42实验结果分析 2→33→22↑32433+44→3314344 表3~表5为数据缺省率分别为5%、10%、15%的学习结 果,其中Log-oss为对数损失,h-d为 Hamming距离,ime的单 E2 0.90.1 0.6 位为秒。+2 edges为添加边5→7,59。+4 edges为再加上两个 0.9 0000 不可能事件2→3,4→3。 0 00.931 0.069 表3缺省率5% 3.2KB_SEM算法 Sample=200 3.2.1算法思想 missing 5%0 time Log-loss h-d time Log-loss h-d 建模前,先由相应领域的专家组成专家小组,再让专家分 SEM 1571-7.69013368869429 别给岀最可能和最不可能事件,然后用冂)-S证据理论根据事 +2 edges1015-4.266113865-7.0107 KB-SEM 先定乂的阀值,确定最终要接受的专家知识并组成禁忌表 +4 edges1262-4.265114370-7.1025 ( babu list)并体现在构建的初始网络中。在每次循环中的结构 表4缺省率10% 搜索中,凡被忌表约東的路径不被搜索,并在每次搜索的最 后,对当前选中的网络进行拓扑排序,以确保禁忌表在下次循 Sample=200 Sample=500 missing 10%0 time Log-loss h-d time Log-loss h-d 环中的有效性。禁忌表的引入,一方面可以约束算法的搜索路 SEM 2321-7.935169206-7.19410 径,缩小算法的搜索空间,另一方面,禁忌表中约定的项目可以 +2 edges2155-8.0751479807.2328 体现在最终的网络结构中,因为这个结果包含了专家的主观判 KB-SEM +4 edges2130-7.95585233-7.2826 断,所以容易被专家所接受。 KB-SEM算法是由领域专家知识和数据学习组成的有机 表5缺省率15% 结合体,可以在一定程度上缩小算法的搜索空间,提高算法的 Sample=200 Sample=500 学习精度,避免主观偏见和数据噪音给学习结果带来的片面 time Log-loss h-d time Log-lo 性,产生一个对专家有高接受率的网络。 SEM 2165-8.3851940338-7.44419 3.22算法描述 KB-SEl +4 edges1600-8.3351139437-7.632 采纳专家意见,行成禁忌表 tabu list和初始网络。 随机选定参数M和θ 由表3可看出:当缺省率为5%时,加入先验信息后, pn=0,1,…直至算法收敛 Hamming距离有显著的降低,Log-os变化不大,表明KB- lol=0,1,…直至算法收敛或者l=l SEM算法明显提高了学习的精度;表4和表5中的缺省率分 {在 tabu list所规定的模型空间中,选择M; 别为10%和15%时,在 Hamming距离有较大幅度缩小的同时, 使得θ= arg max Q(:M,0,b); 算法所耗用的CPU时间也显著降低,表明KB-SEM算法在整 体性能上优于标准的SEM算法,对于小样本缺省数据,KB SEM算法能有效地提高算法的学习精度和时间性能,且能在 定程度上避免主观偏见和数据噪音的干扰。 将Scor(M:θ,D)和Scor(M:θ,D)中得分最大的模型进行拓 扑排序后赋给M; 5结语 将M模型的参数赋给θ SEM算法虽可用于具有缺省数据的贝叶斯网络结构的学 习,却需要用大的训练样本集来改善算法本身存在的一些缺 陷,如:学习精度不够高、算法收敛速度慢和容易陷入局部最 4实验结果和分析 优。而现实中,很难搜集到足够多的训练样本。本文提出结构学 4.1实验环境和数据 习改进算法KB-SEM,将专家知识以禁忌表的形式融入SEM 本文的算法实现环境为 MATLAB6.5,运行环境为操作系算法中,以约東算法的搜索空间,达到提高SEM算法精度的目 http://www.ai.nit.edu/murphyk/software/bnt/bnt.html 下转41页)

...展开详情
试读 3P 论文研究-基于领域知识的贝叶斯网络结构学习算法.pdf
立即下载 低至0.43元/次 身份认证VIP会员低至7折
    抢沙发
    一个资源只可评论一次,评论内容不能少于5个字
    weixin_38744435 你的留言是对我莫大的支持
    2019-09-08
    • 至尊王者

      成功上传501个资源即可获取
    关注 私信 TA的资源
    上传资源赚积分,得勋章
    最新推荐
    论文研究-基于领域知识的贝叶斯网络结构学习算法.pdf 9积分/C币 立即下载
    1/3
    论文研究-基于领域知识的贝叶斯网络结构学习算法.pdf第1页

    试读已结束,剩余2页未读...

    9积分/C币 立即下载 >