没有合适的资源?快使用搜索试试~ 我知道了~
1. Apriori 与FP-Growth算法流程图 2. Apriori与FP-Growth算法效率对比 3. FP-Growth算法后加入关联规则 4. 总
资源详情
资源评论
资源推荐
1. Apriori 与FP-Growth算法流程图
1.1. 基本概念
支持度:P(A ∩ B),既有A又有B的概率
置信度:P(B|A),在A发生的事件中同时发生B的概率 p(AB)/P(A)
频繁k项集:如果事件A中包含k个元素,那么称这个事件A为k项集事件A满足最小支持度阈值的事件称为频繁k
项集
强规则:同时满足最小支持度阈值和最小置信度阈值的规则称为强规则
1.1. Apriori 算法过程
1.2.1 算法描述
第一步通过迭代,检索出事务数据库中的所有频繁项集,即支持度不低于用户设定的阈值的项集;
第二步利用频繁项集构造出满足用户最小信任度的规则。具体做法就是:首先找出频繁1-项集,记为L1;然后利用L1
来产生候选项集C2,对C2中的项进行判定挖掘出L2,即频繁2-项集;不断如此循环下去直到无法发现更多的频繁k-
项集为止。每挖掘一层Lk就需要扫描整个数据库一遍。
1.2.2 逻辑流程图
1.2.3 算法流程图
1.2. FP-Growth 算法过程
1.3.1 算法步骤
先扫描数据库,统计所有属性的出现次数(频数),然后按照频数递减排序,删除频数小于min_suppt(最小支持
度)的属性。
对每一条数据记录,重新排序(从大到小),并删除小于min_suppt的商品。并插入到FP-tree中。
从FP-Tree中划分出条件模式库。
构建条件频繁模式树。
挖掘频繁项集。
1.3.2 逻辑流程图
1.3.3 算法流程图
2. Apriori与FP-Growth算法效率对比
2.1. Apriori 算法实现
代码详见附录1
2.2. FP-Growth算法实现
剩余12页未读,继续阅读
杜拉拉到杜拉拉
- 粉丝: 16
- 资源: 325
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0