没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
simstring Python实现,这是一种用于近似字符串匹配的简单高效的算法。 产品特点 使用此库,您可以从大量的字符串/文本中提取具有一定相似性的字符串/文本。 当您开发与语言处理有关的应用程序时,它将为您提供帮助。 该库支持各种相似度函数,例如余弦相似度,Jaccard相似度,并支持Word N-gram和Character N-gram作为特征。 您还可以轻松实现自己的特征提取器。 SimString具有以下功能: 快速的近似字符串检索算法。 100%精确检索。 尽管某些算法允许未命中(误报)以提高查询响应速度,但可以确保SimString通过快速查询响应实现100%正确的
资源推荐
资源详情
资源评论
收起资源包目录
simstring-master.zip (39个子文件)
simstring-master
env.yml 131B
Dockerfile 244B
tests
database
test_dict.py 1KB
test_mongo.py 919B
__init__.py 0B
test_searcher.py 867B
feature_extractor
test_mecab_ngram.py 866B
__init__.py 0B
test_character_ngram.py 805B
measure
test_cosine.py 1KB
test_dice.py 1024B
test_jaccard.py 1KB
__init__.py 0B
LICENSE 1KB
dev
data
unabridged_dictionary.txt 2.6MB
company_names.txt 149KB
benchmark_for_elasticsearch.py 2KB
benchmark.py 2KB
company_names.py 956B
docker-compose.yml 400B
setup.py 813B
.circleci
config.yml 808B
README.md 6KB
simstring
database
__init__.py 0B
dict.py 1KB
mongo.py 1KB
base.py 395B
feature_extractor
mecab_ngram.py 2KB
word_ngram.py 551B
__init__.py 0B
character_ngram.py 303B
base.py 337B
__init__.py 0B
searcher.py 3KB
measure
jaccard.py 533B
__init__.py 0B
cosine.py 561B
dice.py 561B
base.py 362B
共 39 条
- 1
资源评论
师爷孙
- 粉丝: 16
- 资源: 4757
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 2225060346-汤岚淇-实验15路由交换综合实验.docx
- 2225060346-汤岚淇-实验04以太网基础.doc
- 2225060346-汤岚淇-实验05VLAN配置.doc
- 2225060346-汤岚淇-实验02远程登录.doc
- 基于积分型滑模控制器的永磁同步电机FOC 1.转速环基于积分型滑模面设计积分型滑模面结构控制器,采用指数趋近律来提高系统的动态性能 2.提供算法对应的参考文献和仿真模型
- 1_Project6.zip
- 在线工具源码/站长工具源码站长在线工具集合源码
- password.cpp
- 实验1-参考资料-Linux系统使用实验指导.pdf
- 实验1-讲稿-Linux的基本使用和管理.doc
- 实验1-备份实验-vi编辑器和gcc编译器.pdf
- 实验3-实验报告.doc
- 实验2-讲稿-进程管理.pdf
- 实验1-实验报告.doc
- 实验3-讲稿-进程同步.docx
- 实验2-实验报告(2).doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功