关联规则挖掘 FP-tree
根据给定的文件信息,我们可以生成以下知识点: 1. 关联规则挖掘:关联规则挖掘是数据挖掘中的一种技术,旨在发现数据集中隐含的关联规则。关联规则挖掘有多种算法,包括 Apriori 算法和 FP-growth 算法等。 2. FP-tree:FP-tree 是一种基于频繁模式树的关联规则挖掘算法。它的主要思想是将事务数据库压缩成一棵频繁模式树(FP-树),以便快速发现频繁项集和关联规则。 3. FP-growth 算法:FP-growth 算法是基于 FP-tree 的关联规则挖掘算法。它采用“分而治之”的策略,将提供频繁项目集的数据库压缩成一棵频繁模式树(FP-树)。FP-growth 算法优于 Apriori 算法。 4. FP- 树构造过程:FP- 树构造过程包括两步:第一次扫描事务数据库,导出频繁项(1-项集)的集合,并得到他们的支持度计数;第二次扫描事务数据库,每个事务中的项按 L 中的次序处理,并对每个事务创建一个分枝。 5. FP- 树的构成:FP- 树由多个节点组成,每个节点对应一个项,节点之间通过链接关系构成树状结构。 6. 节点计数:每个节点都有一个计数,记录该节点出现的次数。 7. 分枝共享:FP- 树中的分枝可以共享前缀路径,以减少树的深度和宽度。 8. 节点链接:FP- 树中的节点之间通过链接关系构成树状结构,每个节点都有一个指针指向其子节点。 9. FP- 树的应用:FP- 树可以应用于关联规则挖掘、频繁项集挖掘、数据挖掘等领域。 10. 关联规则挖掘的应用:关联规则挖掘有广泛的应用,如推荐系统、市场营销、客户关系管理等。 11. 数据挖掘:数据挖掘是指从大量数据中发现有价值的知识或模式的过程。关联规则挖掘是数据挖掘的一种重要技术。 12. 频繁项集:频繁项集是指在事务数据库中频繁出现的项集。频繁项集是关联规则挖掘的基础。 13. 支持度计数:支持度计数是指项或项集在事务数据库中的出现次数。 14. 项集:项集是指事务数据库中的一个或多个项的集合。 15. 事务数据库:事务数据库是指一个或多个事务的集合,每个事务是一个项集。 16. 项:项是指事务数据库中的一个基本单元,可以是商品、服务、事件等。 关联规则挖掘 FP-tree 是一种高效的关联规则挖掘算法,基于频繁模式树的构造和挖掘。FP-growth 算法是基于 FP-tree 的关联规则挖掘算法,具有高效和准确的特点。
剩余32页未读,继续阅读
- liyan_keyuan2013-03-27程序的架构挺清晰,具体的设计步骤不是很清楚
- sphz2013-06-27介绍的很详尽,值得参考
- offcourse2012-05-23还不错,就是需要时间多多研究
- 粉丝: 3
- 资源: 100
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助