没有合适的资源?快使用搜索试试~ 我知道了~
awesome-document-similarity:精选的文档相似性度量资源清单(论文,教程,代码等)
共2个文件
license:1个
md:1个
需积分: 5 0 下载量 173 浏览量
2021-05-28
03:01:54
上传
评论
收藏 9KB ZIP 举报
温馨提示
出色的文档相似性度量 精选的有关文档相似性度量的资源列表,例如论文,教程,代码等。 动机 该存储库的目的是为学生和研究人员提供全面的概述。 文档相似性度量是自然语言处理(NLP)和信息检索(IR)领域中若干下游应用程序的基础。 其中最常见的应用是聚类,重复或卑鄙的检测以及基于内容的推荐系统。 我们选择以下内容时,首先要考虑推荐系统的应用程序。 特别是,我们专注于需要评估长格式和内容丰富的文档的相似性的文献推荐系统。 “长格式”指的是+100个句子中文档内容的数量,而内容丰富的意思是文档中除了文本之外还包含图像,数学方程式和引文/链接。 相似度 例如,当文档涵盖相同主题,使用一组通用单词或使用相同字体书写时,它们可能被声明为相似文档。 在IR中,相似性的维度定义了对相似性的理解。 我们区分以下几个方面:词汇,结构和语义文档的相似性。 而且,相似性不是二元决策。 在许多情况下,将两件事声明为
资源推荐
资源详情
资源评论
收起资源包目录
awesome-document-similarity-master.zip (2个子文件)
awesome-document-similarity-master
LICENSE 1KB
README.md 19KB
共 2 条
- 1
资源评论
可吸不是泥
- 粉丝: 27
- 资源: 4552
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功