没有合适的资源?快使用搜索试试~ 我知道了~
矢量空间模型中的文本相似性:比较研究-研究论文
需积分: 10 0 下载量 164 浏览量
2021-06-10
04:03:33
上传
评论
收藏 685KB PDF 举报
温馨提示
试读
17页
语义文本相似度的自动测量是自然语言处理中的一项重要任务。 在本文中,我们评估了不同向量空间模型执行此任务的性能。 我们解决了专利间相似性建模的现实问题,并比较了 TFIDF(和相关扩展)、主题模型(例如,潜在语义索引)和神经模型(例如,段落向量)。 与预期相反,文本嵌入方法增加的计算成本仅在以下情况下是合理的:1)目标文本被压缩; 2)相似度比较是微不足道的。 否则,TFIDF 在其他情况下表现出奇的好:特别是对于更长和更技术性的文本,或者在最近邻居之间进行更细粒度的区分。 出乎意料的是,对 TFIDF 方法的扩展,例如添加名词短语或增量计算术语权重,在我们的上下文中没有帮助。
资源推荐
资源评论
资源评论
苹果虾丸
- 粉丝: 3
- 资源: 871
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- CAN总线的理论分析报告
- Screenshot_2024_0614_022736.png
- update_new.apk
- 如何将keil5中的bin文件合并
- 基于Selenium的Java爬虫实战(内含谷歌浏览器Chrom和Chromedriver版本122.0.6254.0)
- CAN波特率为100kbps时分支线长度
- 74LS90实现十进制计数器、百进制计数器-multisim电路仿真设计
- 基于Selenium的Java爬虫实战(内含谷歌浏览器Chrom和Chromedriver版本122.0.6253.0)
- this is incompatible with sql-mode=only-full-group-by
- YOLO损坏的苹果检测数据集【目标检测数据集】
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功