一、BitMap
解决的问题:大数据量下的排序、查找、去重。
1、关键
通过 bit位 表示一个数值的状态(是否存在),那么1MB能大约表示 800万数值 (1,000,000B * 8 bit )
2、局限性:
1、内存限制:10位的数值(即99亿), 占用 1.25GB内存
2、一般应用在数值类型。字符串映射到 BitMap 存在Hash碰撞的问题(引入bloom filter)
3、不适合数据稀疏。比如要存入(10,10000,100000000)这三个数据(引入 Roaring BitMap)
3、应用场景
对 不重复的 密集整数 进行排序
查找数据是否存在海量集合中
找出没有重复的数
- 1
- 2
前往页