没有合适的资源?快使用搜索试试~
我知道了~
文库首页
大数据
数据挖掘
基于文本集密度的特征词选择与权重计算方法
基于文本集密度的特征词选择与权重计算方法
数据挖掘
需积分: 12
14 下载量
83 浏览量
2008-03-24
19:17:01
上传
评论
收藏
188KB
PDF
举报
温馨提示
立即下载
数据挖掘文献,分词权重计算
资源推荐
资源评论
基于层次特征词权重的文本分类方法
浏览:128
基于层次特征词权重的文本分类方法
统计与规则相结合的新词识别算法研究
浏览:175
新词识别问题的解决方案主要有两种,一种是基于概率统计的,另一种是基于规则的。本文在两者的基础上,实现统计与规则相结合的新词识别检测问题。首先从熟语料中构建N元组候选词库,然后对候选词库分别进行规则过滤,互信息过滤以及位置成词率过滤,再经过N元组重叠标记得到各自不同的新词表。最后综合三种方法,实现统计与规则相结合的新词识别算法,实验结果表明新词识别准确率达到88%。
结合词义的文本特征词权重计算方法 (2012年)
浏览:147
传统的基于向量空间模型的文本相似度计算方法,用TF-IDF计算文本特征词的权重,忽略了特征词之间的词义相似关系,不能准确地反映文本之间的相似程度。针对此问题,提出了结合词义的文本特征词权重计算方法,基于Chinese WordNet采用词义向量余弦计算特征词的词义相似度,根据词义相似度对特征词的TF-IDF权重进行修正,修正后的权重同时兼顾词频和词义信息。在哈尔滨工业大学信息检索研究室多文档自动文
特征权重的计算方法
浏览:30
4星 · 用户满意度95%
文档介绍了文本分类中特征值权重的计算方法,对基于vsm的文本分类有很大帮助
云计算-文本特征项的权重计算方法研究.pdf
浏览:141
云计算-文本特征项的权重计算方法研究.pdf
论文研究-情感分类中基于词性嵌入的特征权重计算方法.pdf
浏览:159
提出了一种基于词性嵌入的特征权重计算方法,通过构造一种特征嵌入模式将名词、动词、形容词、副词四种词性对情感分类的贡献度嵌入到传统的TF-IDF(Term Frequency-Inverse Document Frequency)权值中。其中,词性...
论文研究-基于文档类密度的特征权重算法.pdf
浏览:86
为了提升文本分类的质量,针对传统特征权重算法的不足,提出了基于文档类密度的特征权重算法(TF-IDCD)。其中,文档类密度通过类内包含特征的文档数与类内总文档数的比值来度量。最后,在两个中文常见数据集上对五...
论文研究-基于不同权重的多标签分类器准确性评估方法.pdf
浏览:179
文本聚类关键是有效解决特征词向量选择及特征词权重计算方法、文本相似度计算方法、聚类中心确定等三个问题。针对相关算法在三个关键环节上存在的问题,提出了适合自由文本特点的特征词权重计算方法和文本相似度计算...
论文研究-邻域粗糙集在属性约简及权重计算中的应用.pdf
浏览:148
为了减少航天器特征值属性的冗余性并提高其权重的准确性,提出了一种基于邻域粗糙集的属性约简及权重计算方法。通过对不同重要度下限分类精度的对比分析,给出了确定邻域半径的新规则。在信息观权值最优计算公式的...
论文研究-动态自适应特征权重的多类文本分类算法研究.pdf
浏览:19
文本分类是研究文本数据挖掘、信息检索的重要手段,文本特征项权重值的计算是文本分类算法的关键。针对经典的特征权重计算方法TF-IDF中存在的...实验结果表明,采用DATW方法计算特征权重可以有效提高文本分类的性能。
论文研究-基于层次分析法的微博文本特征权重计算方法 .pdf
浏览:7
基于层次分析法的微博文本特征权重计算方法,黄晓军,王博,为了发现相同兴趣偏好的微博用户群以及解决微博用户兴趣建模问题,本文利用经典的层次分析法,综合考虑微博转发数、评论数、点赞
论文研究-基于信息熵理论的特征权重算法研究.pdf
浏览:90
针对经典的特征权重计算方法TFIDF(Term Frequency and Inverted Document Frequency)中存在的不足,提出了一种基于信息熵理论的特征权重算法ETFIDF(Entropy based TFIDF)。ETFIDF不仅考虑特征项在文档中出现的...
KNN文本分类中特征词权重算法的研究
浏览:199
KNN文本分类中特征词权重算法的研究 机器学习
matlab基于Relief算法的特征权重选择_有效地选择出了权重数据_matlab
浏览:6
5星 · 资源好评率100%
资源名:matlab基于Relief算法的特征权重选择_有效地选择出了权重数据_matlab 资源类型:matlab项目全套源码 源码说明: 全部项目源码都是经过测试校正后百分百成功运行的,如果您下载后不能运行可联系我进行指导...
论文研究-基于词频类别相关的特征权重算法.pdf
浏览:78
在文本分类领域中,目前关于特征权重的研究存在两方面不足:一方面,对于基于文档...最后,通过与其他五个特征权重度量方法相比较,在三个数据集上进行分类实验,结果显示,CDF-AICF的分类性能优于其他五种度量方法。
层次分析法权重计算方法分析及其应用研究_邓雪.pdf
浏览:134
介绍层次分析法的基本概念,同时也分析了层次分析法权重的计算方法及应用,层次分析法的计算方法有四种方法:几何平均法、算术平均法、特征向量法、最小二乘法,以往的文献利用层次分析法解决实际问题时,都是采用其中的...
云计算-文本分类中词语权重计算方法的改进及应用.pdf
浏览:8
云计算-文本分类中词语权重计算方法的改进及应用.pdf
论文研究-基于语义的文本特征加权分类算法.pdf
浏览:34
该方法首先对数据集进行去噪处理, 结合特征提取算法和语义分析方法对数据实现降维, 再利用词语语义相关度对文本特征向量中每个特征词赋予不同权重; 并利用经过上述处理的文本数据学习分类器。实验结果表明, 该文本...
论文研究-基于权重差异和类别关联的互信息改进研究.pdf
浏览:94
作为文本分类中常用的特征选择方法,互信息在进行特征权重计算时,未考虑特征的正、负相关性及其影响程度的不同,同时也忽略了特征在类别中的分布情况。针对以上不足,通过分别引入权重差异因子和类别关联因子进行互...
论文研究-考虑物品相似权重的用户相似度计算方法.pdf
浏览:129
传统的用户相似度计算方法中...通过在MovieLens数据集上进行实验,与基于传统用户相似度计算方法的协同过滤算法比较,实验结果表明,考虑了项目相似度权重的协同过滤算法能显著提高评分预测的准确性和推荐系统的质量。
第一讲:python网络爬虫基础知识
浏览:168
本讲主要内容包括Python常见数据类型、循环与控制流以及常见的错误处理方法。这些Python基础知识非常重要,是后面进行爬虫练习必备也是最少基础内容。
Python基于机器学习实现的股票价格预测、股票预测源码+数据集,机器学习大作业
浏览:34
3星 · 编辑精心推荐
python数据分析,因为股票价格的影响因素太多,通过k线数据预测未来的价格变化基本不可行,只有当天之内的数据还有一定的关联,故feature与target都选择的是当天的数据。 加载数据 为了加快数据的处理速度,提前将mariadb数据库中的数据查询出来,保存成feather格式的数据,以提高加载数据的速度。 经过处理,不同股票的数据保存在了不同的文件中,列名还保持着数据库中的字段名。我选择了股
身份证前6位对应的省市区代码(超详细)
浏览:123
身份证前6位对应的省市区代码(超详细)
抖音用户浏览行为数据集
浏览:184
抖音用户浏览行为数据集 文章: [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(一)](https://blog.csdn.net/m0_53054984/article/details/136121177) [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(二)](https://blog.csdn.net/m0_53054984/article/details/136123131
【Python实战】-Python+Opencv是实现车牌自动识别(源码+数据+字符匹配模板)
浏览:93
在这个实战项目中,我们将利用Python结合OpenCV库来实现车牌识别功能。整个过程涵盖图像预处理、车牌定位、车牌字符分割以及模板匹配识别等关键步骤,对智能交通、车辆管理等实际应用领域具有显著价值。 首先,我们需要对获取的车辆图像进行预处理,这通常包括灰度化、二值化、滤波去噪等操作,以便更好地凸显车牌区域。接着,利用OpenCV的图像处理功能,我们可以实现车牌定位。这通常涉及边缘检测、轮廓查找
两阶段鲁棒优化/综合能源系统/需求响应/微电网/多目标优化/优化调度matlab-yalmip-cplex/gurobi文章复现
浏览:7
基于多目标灰狼的冷热电联拱型微电网允许优化/ 考虑用户侧柔性负荷的社区综合能源系统日前优化调度(完美复现)matlab-yalmip-cplex/gurobi代码/ 基于场景的多区域综合能源优化调度(随机优化)(完美复现)matlab-yalmip-cplex/gurobi代码/ 考虑阶梯式碳交易机制与电制氢的综合能源系统热电优化(完美复现)matlab-yalmip-cplex/gurobi代码
SPSS中介效应分析插件(Process和mediate插件)
浏览:188
5星 · 资源好评率100%
包含Process和mediate插件
基于在线教学平台的数据挖掘与学习行为分析超星集团数据集
浏览:37
基于在线教学平台的数据挖掘与学习行为分析超星集团数据集
Fragstats V4.2 软件计算景观指数的参数文件示例
浏览:55
Fragstats V4.2 软件计算景观指数的参数文件示例。
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
linseng129
粉丝: 4
资源:
6
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
17.cpp
1_SoundCollection-Android-v1.0.5.12-release.apk.1.1.1.1.1
22222222222222
DPT-LCR1000高温介电温谱测试系统
YMJC-1000型云母材料耐压击穿测试仪
ISBN图书基础数据资源12
ISBN图书基础数据资源11
PCB线宽及载流能力计算工具-表层微带线与内层带状线.xls
使用BP神经网络、RBF神经网络以及PSO优化的RBF神经网络进行数据的预测
特性阻抗与差分阻抗计算工具-微带线与带状线.xlsx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功