没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
第
卷
第
期 西 南 师 范 大 学 学 报
(
自然科学版
)
年
月
(
)
文章编号
:
(
)
基于二进制编码的优化关联规则挖掘算法
王 仕 平
成都学院 信息科学与技术学院
成都
摘要
:
提出了一种基于二进制编码的优化关联规则挖掘算法
该算 法是 按项目 支持 数的升 序 从高 到低 地 编制 二进
制位
然后将事务转换成数字事务
通过构建候选数字事务区间来搜索频繁数字事务
最后产生关联规 则
该算 法
的原理简单
减少了冗余候选项和扫描次数
实验结果表明该算法比同类挖掘算法更快速而有效
关
键
词
:
关联规则
二进制项目
数字事务
候选数字事务区间
中图分类号
:
TP311
文献标志码
:
A
关联规则是一个重要的
研究课题
它反映了大量数据项目之间的有趣关联
目前
针对关联规则
挖掘算法
的运算量及技术难点
目前人们已经提出了许多挖掘算法
如文献
和
从牺牲
存储空间方面来减少数据库的 扫 描次数
避免使用 传 统 的
存 储
而 采 取 了
的 存 储 结
构
虽然这些算法在减少候选项目集的个数以及减少扫描数据库的次数等方面均取得了较好的效果
但大
部分算法仍然沿用了
和
的思想
为了进一步改进传统挖掘算法
和
的不
足
人们又提出了基于二进制的挖掘算法
如文献
在现有文献 中具有代表 性的算法是
和
它们为了产生候选频繁项目集
用函数
的思想设计 了
算法
该算法仍采
用了输入频繁
k
项目集
L
k
输出候选频繁
k
项目集
C
k
的方法
搜索策略为自底向上方式
同时通
过移位操作
进而生成了基于二进制形式的候选频繁项目集
另外该类算法在计算候选频繁项目集的支持
数时
采用了二进制的逻辑
与
或
和
异或
等操作来实现
减少了计算和扫描次数
提高了算法 的执行
效率
文献
的算法用到了移位操作和二进制逻辑运算
但这些算法都没有将事务数据转换成数值
文献
在打破传统挖掘算法
的基础之上提出了基于二进制的挖掘算法
虽然这些算法都将事务数
据转换成了数值
但却没有优化二进制编码
导致冗余候选项和计算仍然存在
其算法效率 有待进一步 提
高
为此
本文提出了一种基于 二 进制编码 的 优化关联 规 则 挖 掘 算 法
该算法减少了候选项的个数和扫描数据库的次数
达到了提高挖掘算法
效率的目的
1
优化关联规则挖掘算法
1.1
相关定义及性质
定义
1
二进制事务
记为
BT
就是用一个二进制数表示一个数据事务
用二进
制数表示数据事务的方法如下
收稿日期
作者简介
王仕平
男
成都都江堰人
讲师
主要从事数据挖掘
数据库
的研究
资源评论
weixin_38716519
- 粉丝: 13
- 资源: 910
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功