没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
datasketch:大数据看起来很小 datasketch提供给您概率性的数据结构,这些数据结构可以超快地处理和搜索大量数据,而几乎不会降低准确性。 该软件包包含以下数据草图: 数据草图 用法 估计Jaccard相似度和基数 估计加权Jaccard相似度 估计基数 估计基数 提供了以下数据草图索引以支持亚线性查询时间: 指数 对于数据草图 支持的查询类型 MinHash,加权MinHash 提卡阈值 MinHash,加权MinHash Jaccard Top-K 最小哈希 遏制阈值 datasketch必须与Python 2.7或更高版本以及NumPy 1.11或更高版本一起使用。 Scipy是可选的,但有了它,LSH初始化可以更快。 请注意, 和也支持Redis和Cassandra存储层(请参见 )。 安装 要使用pip安装datasketch: pip insta
资源推荐
资源详情
资源评论
收起资源包目录
datasketch-master.zip (90个子文件)
datasketch-master
README.rst 3KB
.flake8 188B
.github
workflows
python-package.yml 3KB
examples
lshensemble_example.py 1KB
lshforest_example.py 1KB
hyperloglog_examples.py 1KB
lsh_examples.py 2KB
minhash_examples.py 854B
weighted_minhash_examples.py 436B
benchmark
sketches
hyperloglog_benchmark.py 2KB
weighted_minhash_benchmark.py 2KB
minhash_benchmark.py 2KB
inclusion_benchmark.py 4KB
cardinality_benchmark.py 3KB
b_bit_minhash_benchmark.py 3KB
similarity_benchmark.py 4KB
indexes
jaccard
plot_topk_benchmark.py 3KB
utils.py 8KB
lshforest.py 2KB
lsh.py 1KB
requirements.txt 48B
exact.py 2KB
topk_benchmark.py 6KB
hnsw.py 1KB
containment
utils.py 827B
requirements.txt 52B
lshensemble_benchmark.py 10KB
lshensemble_benchmark_plot.py 6KB
.travis.yml 1KB
LICENSE 1KB
test
test_weighted_minhash.py 1KB
aio
test_lsh_mongo.py 20KB
__init__.py 0B
utils.py 68B
test_lean_minhash.py 6KB
__init__.py 0B
test_lsh_cassandra.py 9KB
test_lshensemble.py 3KB
test_lshforest.py 6KB
test_lsh.py 10KB
test_hyperloglog.py 6KB
test_minhash.py 7KB
setup.py 3KB
Makefile 224B
travis
wait_for_cassandra.sh 1KB
datasketch
minhash.py 13KB
b_bit_minhash.py 6KB
experimental
aio
lsh.py 15KB
__init__.py 0B
storage.py 11KB
__init__.py 458B
lshensemble.py 10KB
lshforest.py 6KB
hyperloglog.py 12KB
lsh.py 13KB
__init__.py 611B
storage.py 35KB
hyperloglog_const.py 71KB
weighted_minhash.py 5KB
hashfunc.py 646B
version.py 20B
lean_minhash.py 9KB
lshensemble_partition.py 7KB
docs
documentation.rst 1KB
minhash.rst 4KB
.nojekyll 0B
lsh.rst 15KB
conf.py 10KB
lshforest.rst 5KB
weightedminhash.rst 3KB
index.rst 85B
Makefile 7KB
hyperloglog.rst 2KB
lshensemble.rst 5KB
_static
weighted_minhash_benchmark.png 56KB
hyperloglog_benchmark.png 52KB
lshensemble_benchmark_1k
lshensemble_num_perm_256_recall.png 25KB
lshensemble_num_perm_256_precision.png 30KB
lshensemble_num_perm_256_fscore.png 29KB
lshensemble_num_perm_256_query_time.png 15KB
lshforest_benchmark.png 49KB
containment.png 23KB
hashfunc
minhash_benchmark_mmh3.png 54KB
minhash_benchmark_farmhash.png 54KB
minhash_benchmark_sha1.png 53KB
minhash_benchmark_xxh.png 53KB
b_bit_minhash_benchmark.png 61KB
lsh_benchmark.png 85KB
minhash_benchmark.png 54KB
.gitignore 944B
共 90 条
- 1
资源评论
风花雪月不等人
- 粉丝: 26
- 资源: 4645
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功