一、关联规则概念
规则就是一个条件和一个结果的和: If condition then result 。
1. Support (支持度):是一个元组在整个数据库中出现的概率。
Support=P(condition and result ) 。 (1)
如 : if A then B 。则它的支持度 Support=P(A and B)
2. Condence (可信度):它是针对规则而言的。
Condence=p(condition and result)/p(condition) 。 (2)
如: If B and C then A 。则它的可信度 Condence=p(B and C and
A)/p(B and C) 。
把满足最小支持度阈值和最小置信度阈值的规则成为强规则。项的集合
称为项集( itemset ),包含 K 个项集称为 K -项集,如果项集满足最小
支持度,则称它为频繁项集。
3. Lift (提高率或兴趣度) : 使得所挖掘的规则更符合需求。
Lift=p(condition and result)/(p(condition)*p(result)) 。 (3)
当 Lift 大于 1 的时候,这条规则就是比较好的;当 Lift 小于 1 的时候,这
条规则就是没有很大意义的。 Lift 越大,规则的实际意义就越好。
第 2 页 / 共 11 页