挖掘可擦除项目集于2009年首次推出,是新兴的数据挖掘任务之一。 在本文中,我们提出了一种称为NC_set的新数据表示形式,它可以跟踪用于挖掘可擦除项目集的完整信息。 基于NC_set,我们提出了一种称为MERIT的新算法,可有效地挖掘可擦除项目集。 MERIT的效率可通过以下三种技术来实现。 首先,NC_set是一个紧凑的结构,可以自动修剪无关的数据。 其次,将项目集的增益的计算转换为NC_sets的组合,可以通过巧妙的策略以线性时间复杂度完成该操作。 第三,在某些情况下,MERIT可以直接找到可擦除项目集,而无需生成候选项目集。 为了评估MERIT,我们在许多合成产品数据库上进行了广泛的实验。 我们的性能研究表明,MERIT是高效的,并且平均比META(用于挖掘可擦除项目集的第一种算法)快约两个数量级。