没有合适的资源?快使用搜索试试~ 我知道了~
DIYNLP:一个句子相似度算法包,适合中文句子进行相似度分析
共6个文件
py:3个
md:2个
model:1个
需积分: 50 2 下载量 109 浏览量
2021-05-14
17:35:40
上传
评论 1
收藏 985KB ZIP 举报
温馨提示
DIY中文NLP算法包 这是一个DIY的中文NLP算法包,具体算法分析请参见https://blog.csdn.net/greepex/article/details/80493045 其中有关于短文本相似度以及情感极性分析的算法。 短文本相似度算法(distance.py) 基于分词后单词: edit_similar(str1,str2):编辑距离相似度,输入为分词后的两个句子的列表,返回值为两者相似度。 cos_sim(str1, str2):余弦相似度,输入为分词后的两个句子的列表,返回值为两者相似度。 基于字符: difflib.SequenceMatcher(None,str1,str2).ratio():difflib为python自带的库,str1和str2无需分词。 综合相似度: compare(str1, str2):输入是两个字符串(中文句子),无需分词,返回值为两者相
资源推荐
资源详情
资源评论
收起资源包目录
DIYNLP-master.zip (6个子文件)
DIYNLP-master
model
SA.model 3.37MB
readme.md 25B
__init__.py 1B
SA.py 286B
README.md 976B
distance.py 2KB
共 6 条
- 1
资源评论
实话直说
- 粉丝: 38
- 资源: 4592
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功