实例说明
Sequence_id Sequence
10 <a(abc)(ac)d(cf)>
20 <(ad)c(bc)(ae)>
30 <(ef)(ab)(df)cb>
40
<eg(af)cbc>
表一中给定的运行的序列数据库是 S ,并且支持度 min_support=2. 在数据库中
的一组项是 {a,b,c,d,e,f,g} 。
序列 <a(abc)(ac)d(cf)> 有五个元素, (a),(abc),(ac),(d) 和 (cf) 。该序列的序列长度
是 9 ,因为序列中一共有 9 个项。序列 <a> 的支持数是 1 ,因为在整个数据库中
<a> 只出现了一次。序列 <a(bc)df> 是 <a(abc)(ac)d(cf)> 的一个子序列。
因为 10 号序列中包含 2 个 <(ab)c> 子序列, 30 号序列中包含了 1 个 <(ab)c> 子
序列,所以在整个数据库中共包含了 3 个 <(ab)c> 子序列,所以 <(ab)c> 序列的支持
数是 3>min_support=2, 所以 <(ab)c> 是一个序列模式。
评论18
最新资源