没有合适的资源?快使用搜索试试~
我知道了~
文库首页
行业
互联网
vsm模型计算文本相似度
vsm模型计算文本相似度
共1个文件
zip:1个
需积分: 46
3 下载量
164 浏览量
2021-01-13
13:32:16
上传
评论
1
收藏
19.89MB
ZIP
举报
温馨提示
立即下载
1.采用经典的vsm模型实现的文本相似度计算。 2.采用中科院ictclas的开源分词系统 3.包含全部实现源码
资源推荐
资源详情
资源评论
论文研究-基于VSM的文本相似度计算的研究.pdf
浏览:151
文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果。提出改进的DF算法和TDIDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加关键词的方法,弥补了其对个别有用信息错误过滤的不足;另一方面,利用特征项在特征选择阶段的权重对TDIDF方法进行加权处理,在不增加开销的情况下扩大了文档集的规模,还提高了相似
基于vsm模型的文本相似度检查软件的设计与实现.doc
浏览:49
基于vsm模型的文本相似度检查软件的设计与实现.doc
VSM.rar_java VSM_java文本相似度_vsm_向量空间模型_文本 VSM
浏览:137
利用向量空间模型对两个文本的相似度进行计算的Java代码
向量空间模型快速文本相似度计算 java源码+数据
浏览:26
5星 · 资源好评率100%
使用向量空间模型以最快速度计算文本之间的相似度,JAVA源码+数据
计算文本相似度
浏览:133
基于关键词Jarccard距离的文本相似度计算 "TF/IDF算法:主要思想是,如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很高的关键度。\n", "\n", "TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出
文本相似度计算
浏览:127
4星 · 用户满意度95%
#include "come.h" void main() { int N; N=4; char a[500]; char b[500]; int choice; while(1) { printf("\n\n请输入第一个字符串:"); gets(a); printf("请输入第二个字符串:"); gets(b); ED aa(a,b); printf("
文本相似度计算的一种新方法
浏览:111
4星 · 用户满意度95%
本文提出了文本相似度计算的一种新方 法.与其它的文本相似度计算公式相比较.该方法跳出传统的 思想.而是采用码字的方法来表征文本信息的特征.它不仅可 以限于关键字等孤立的信息的表征.还为联合地描述文本信 息提供了可能。其次该方法只是利用模2加等运算.其方便性 是不言而喻的.它完全避免了诸如在欧氏空间中求相似度的 大量乘法运算.可较大地提高计算速度
文本相似度计算.ipynb
浏览:27
文本相似度计算.ipynb
基于VSM模型的文本相似度检查软件的设计与实现-本科毕业论文(设计)
浏览:6
5星 · 资源好评率100%
因此,文本相似度检测应运而生。 本次设计的基于 VSM 模型的文档相似度检查系统主要是进行一个理论的研究。系统 适用于对学生提交的实验报告、电子档作业等进行检测,从而提高学生独立完成作业的积 极性。本系统基于...
基于文本相似度的自动文摘评论
浏览:70
基于文本相似度的自动文摘评论 讨论了现有的自动文摘评价方法, 并具体分析了内部评价方法的缺陷, 由此提出了基于文本相似度的自动文摘评价方法。同时, 通过基于VSM( 支持向量机) 相似度和基于语义相似度两种相似度...
基于C#的文本相似度检测
浏览:161
4星 · 用户满意度95%
这是一个基于C#的反作弊系统,基于VSM空间向量模型,能对doc和txt文件进行相似度的检测,在VS2005和SQL Server 2005上实现
基于GVSM的文本相似度算法研究
浏览:166
提出了一种基于WordNet和GVSM的文本相似度算法,通过语义的路径长度和路径深度计算两个词的语义相似度,结合改进的GVSM模型计算文本相似度,并对基于TFIDF-VSM模型和本文方法进行了比较。实验结果表明,该算法取得了...
论文研究-基于隐含语义分析的微博话题发现方法.pdf
浏览:198
针对于短文本、向量空间模型(VSM)文本表示方法存在高维度、稀疏,以及同义多义问题,导致难以准确度量文本相似度,提出一种基于隐含语义分析的两阶段聚类话题发现方法。引入话题热度的概念来选取具有一定关注度的...
易语言向量法计算文本相似度
浏览:59
易语言向量法计算文本相似度源码,向量法计算文本相似度,Similar_Text,初始化,生成CRC32表,取CRC32,去重复,取文本地址,指针到短整数_无符号,清零,取数组地址
文本相似度的计算.pdf
浏览:163
5星 · 资源好评率100%
文本相似度的计算在数字图书馆系统里有着广泛的应用前景。该文采用余弦系数和向量空间模型计算文本相似度。
文本相似度计算数据文本相似度计算数据
浏览:11
5星 · 资源好评率100%
文本相似度计算数据
易语言快速计算文本相似度
浏览:42
易语言快速计算文本相似度源码,快速计算文本相似度,取文本相似度,GetMaxLenSubStr,GetCharList,max
基于LCS的文本相似度计算
浏览:142
一个简单的基于LCS的计算文本相似度的函数,新人所写,高手勿喷
论文研究-一种基于词义和词频的向量空间模型改进方法.pdf
浏览:16
文本内容较多时,传统的向量空间模型(VSM)建模可能产生维数爆炸现象,效率低下且难以保证分类效果。针对VSM高维现象,利用词义和词频降低文本建模维度的方法提高效率和准确度,提出一种多义词判别优化的同义词聚类...
基于向量空间模型确定微博文本影响的优化算法
浏览:140
本文使用向量空间模型来表达微博文本的数量,通过余弦的文本聚类角度的余弦法来计算文本之间的相似度。 通过将“微博客影响因子”添加到替代热点集群的矢量文本模型中,我们可以通过集中化方法生成替代微博客热集群...
基于向量空间模型和专利文献特征的相似专利确定方法 (2009年)
浏览:139
通过分析专利模型树的节点属性值,采用基于向量空间模型的文本分类技术,以专利名称和专利摘要的加权相似度作为专利文献分类的依据,对专利文献进行分类,然后在类内根据专利文献特征的相似性确定相似专利,并根据...
基于主题树的微博突发话题检测 (2014年)
浏览:126
针对传统话题检测方法不能很好处理微博中用语不规范、随意性强、指代不明确以及存在大量网络用语的问题,提出了一种基于...然后,利用该“贡献度”作为空间向量模型(VSM)改进后的参数值计算文档间相似度来提取突发话题
计算文本相似度_jenkins_java_
浏览:64
基于深度学习的文本相似度计算模型和代码,亲自跑过可以直接使用,对nlp领域的学习非常有借鉴意义,在智能问答系统上经常会用到
易语言快速计算文本相似度源码
浏览:10
易语言快速计算文本相似度源码。@易语言资源论坛。
基于Hadoop的文本相似度计算
浏览:25
5星 · 资源好评率100%
基于Hadoop的文本相似度计算的代码 是用TFIDF 和向量空间模型,IKAnlayze来弄的 有代码,只是用来参考的 只是一个算法的演示,用于保存,以后查看的
计算文本相似度代码5.0_代码相似度_unionecb_textcomparison_textsimilarity_文本相似度_
浏览:14
可以比较两段文本相似性,利用C#语言开发。
word2vec文本相似度找出相似的文本,计算与之相似文本个数,语料库
浏览:47
首先,建立自己的语料库 def ylk(x): seg = jieba.cut(x, cut_all=False) with open('D://listTwo.txt', 'a',encoding='utf-8')as f: for word in seg: f.write(word+ ) f.write('\n') 训练
CompareImgAndText:图片相似度计算和文本相似度计算Api
浏览:127
CompareImgAndText 图片相似度计算和文本相似度计算Api
收起资源包目录
zhangdebo-5195337-vsm.zip
(1个子文件)
zhangdebo-5195337-vsm_1610515852
zhangdebo-5195337-vsm.zip
19.89MB
共 1 条
1
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
magicnono
粉丝: 17
资源:
143
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
炫酷代码雨,超级炫酷哦!!!
基于物联网MQTT协议的智能停车场管理系统
基于深度学习的行人检测系统源码+项目说明(YoloV3+Tensorflow).zip
区块链系统:以比特币为基础
直接插入排序(Insertion Sort)是一种简单直观的排序算法.txt
Python实现基于深度学习的预测区域电力负荷模型源码+项目说明(高分项目).zip
esp8266 RTOS SDK 开发环境配置
基于深度学习的预测区域电力负荷模型源码+项目说明(高分项目).zip
合并两个有序链表是一个常见的编程问题.txt
打开注册表的方法有多种,以下是其中的几种常见方法.txt
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功