枯萎病
de Bruijn基于图的索引,具有轻量内存使用
鸟瞰:
Blight是一种类似于哈希表的关联数据结构,能够索引kmer集。 它将每个kmer与唯一的标识符相关联,并且可以标识与标识符-1相关的外星人kmers(索引中不存在的kmer)。 kmer标识符为in [0,N [,其中N是索引中的kmer数。 因此,人们可以将Blight视为处理外星人kmers的最小完美哈希函数(MPHF)。
关键特性:
疫病指数是
确定性的,它不会产生假阳性或假阴性。
根据压缩的de Bruijn图构建
静态的,一旦构造,索引的kmer集就无法修改
即使对于最广泛的kmer集,也具有快速且高效的存储功能
图的构造
要构建Blight索引,需要一个Fasta文件,该文件的序列包含要索引的kmer,没有重复项。 构建此类文件的有效方法是根据兴趣序列构建压缩的de Bruijn图。 我们建议使用BCA
评论0
最新资源