没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
自然语言处理 NLP文本相似度
——
NLP技术-自然语言处理技术
——
NLP文本相似度
自然语言处理 NLP文本相似度
——
NLP技术-自然语言处理技术
——
O u t L i n e
余弦相似度、向量空间模型
TFIDF
【实践】TFIDF
LCS
【实践】LCS
自然语言处理 NLP文本相似度
——
NLP技术-自然语言处理技术
——
相似度
• 相似度度量:计算个体间相似程度
• 相似度值越小,距离越大,相似度值越大,距离越小
• 最常用——余弦相似度
– 一个向量空间中两个向量夹角的余弦值作为衡量两个个体之间差异的大小
– 余弦值接近1,夹角趋于0,表明两个向量越相似
Θ
a
b
cos(𝜃) =
𝑏
a
自然语言处理 NLP文本相似度
——
NLP技术-自然语言处理技术
——
相似度
如果向量a和b不是二维而是n维
自然语言处理 NLP文本相似度
——
NLP技术-自然语言处理技术
——
一个例子
• 句子1:这只皮靴号码大了,那只号码合适
• 句子2:这只皮靴号码不小,那只更合适
• 句子1:这只/皮靴/号码/大了,那只/号码/合适。
• 句子2:这只/皮靴/号码/不/小,那只/更/合适。
这只,皮靴,号码,大了,那只,合适,不,小,更
• 句子1:这只1,皮靴1,号码2,大了1,那只1,合适1,不0,小0,更0
• 句子2:这只1,皮靴1,号码1,大了0,那只1,合适1,不1,小1,更1
• 句子A:(1,1,2,1,1,1,0,0,0)
• 句子B:(1,1,1,0,1,1,1,1,1)
分词
列出所有词
计算词频
词频向量化
套公式计算
剩余26页未读,继续阅读
资源评论
passionSnail
- 粉丝: 407
- 资源: 5624
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- springboot-mavenBaseDemo 内容包含:springboot的maven基础状态,1.8JDK可以直接运行
- otis rsl远程串行接口协议标准.pdf
- buildx构建镜像时所需的镜像文件
- F103-霸道开发板2.8寸电阻触摸屏例程.rar
- Google(高德)地图瓦片python代码下载
- Python实现输出杨辉三角形
- polsarpro官方教程、操作说明 PolSARpro v5.0 Software Training Course
- STM32 TouchGFX的使用二图片显示
- buildx镜像文件,也可以通过网上其他方式获取
- 【中级软件设计师】上午题12-软件工程(2):单元测试、黑盒测试、白盒测试、软件运行与维护
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功