没有合适的资源?快使用搜索试试~
我知道了~
文库首页
课程资源
专业指导
基于向量空间模型的文本自动分类系统的研究与实现
基于向量空间模型的文本自动分类系统的研究与实现
向量空间模型
文本自动分类系统
需积分: 13
8 下载量
145 浏览量
2010-12-09
10:25:58
上传
评论
收藏
193KB
PDF
举报
温馨提示
立即下载
基于向量空间模型的文本自动分类系统的研究与实现
资源推荐
资源评论
基于VSM的中文文本分类系统的设计与实现.pdf
浏览:156
5星 · 资源好评率100%
摘 要: 文本分类是指在给定分类体系下, 根据文本的内容 自动确定文本类别的过程。该文阐述了一个基于向量空间模 型的中文文本分类系统的设计和实现。对文本分类系统的系 统结构、预处理、特征提取、训练算法、分类算法等进行了详 细介绍。引入标题权重系数改进词语权重, 并提出了一种新 的分类算法。实验测试结果表明查全率和准确率均达到 90 %左右, 而且标题权重的引入和新分类算法的实施有效 地改善了分类性
基于向量空间模型的文本自动分类系统的研究与实现 (2003年)
浏览:35
分析了文本自动分类的关键理论及技术,给出一个已实现的基于向量空间模型(VSM)的文本自动分类系统的框架模型,重点描述此系统的实现算法。此算法在训练阶段通过部分训练集确定向量的特征提取维数,并提出一种...
文本自动分类系统的研究与实现VSM/SVM/搜索引擎
浏览:138
5星 · 资源好评率100%
随着网络信息的迅猛发展,信息处理已经成为人们获取有用信息不可缺少...包括向量空间模型、特征提取、机器学习方法,进行了研究和探讨,并且提出了基于向量空间模型的文本分类系统的结构,并给出了评估方法和实验结果。
基于句子向量空间模型的案例知识库关键技术研究
浏览:196
本文重点研究基于本体和句子向量空间模型(SVSM,Sentence Vecter Space Model)的案例知识库关键技术,完成的主要工作如下: 1.建立了案例知识库的三层立体模型,即案例知识抽象层、案例知识实体层、领域知识层;...
基于离散核支持向量机的文本自动分类 (2005年)
浏览:191
传统基于向量空间模型的文本分类方法需要对文档进行预处理,同时也会损失很多有用的信息。该文提出一种基于离散核支持向量机的文本分类方法,直接根据文档的字符序列构造离散核,用于支持向量机分类算法,比较文档...
基于向量空间模型的自动摘要冗余处理研究 (2010年)
浏览:46
文章提出一种基于向量空间模型的自动摘要冗余处理方法,该方法首先根据统计信息进行粗摘要提取,然后利用向量空间模型对粗摘要进行冗余处理;实验结果表明,该方法提取的摘要不受领域知识限制,有效去除冗余,能更好...
论文研究-基于LDA-wSVM模型的文本分类研究.pdf
浏览:165
SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题...实验结果表明,提出的LDA-wSVM模型在文本自动分类中具有很好的优越性能。
论文研究-单词统计特性在情感词自动抽取和商品评论分类中的作用.pdf
浏览:93
利用八种统计特征构造文本向量空间模型,替代基于单词构造文本向量空间模型的方法,能够降低文本向量的维度,具有隐形语义空间(LSA/SVD)的压缩效果,在保证分类结果准确率的前提下有效降低了算法的复杂度,能够...
论文研究-维吾尔文Bigram文本特征提取.pdf
浏览:10
在基于向量空间模型(VSM)的文本表示中特征单元粒度的选择直接影响到文本分类的效果。在维吾尔文文本分类中,对于单词特征不能更好地表征文本内容特征的问题,在分析了维吾尔文Bigram对文本分类作用的基础上,构造...
基于投影寻踪回归文本自动分类的模型 (2005年)
浏览:56
文本被表示为向量空间模型后,是维数非常高的数据,对其进行维数约简是必要的。投影寻踪正是一种稳健的、非参数化的维数约简方法。提出了一种基于投影寻踪回归的文本自动分类模型。应用该模型,可以真实地描述高维...
基于LDA主题模型的短文本分类方法 (2013年)
浏览:177
针对短文本的特征稀疏性和上下文依赖性两个问题,提出一种基于...采用K近邻方法对自动抓取的网易页面标题数据进行分类,实验表明新方法在分类性能上比传统的向量空间模型和基于主题的相似性度量分别高5%和2.5%左右。
论文研究-一种基于粗糙集文本自动分类的改进算法.pdf
浏览:2
基于支持向量机核函数的条件,将Sobolev Hilbert空间的再生核函数进行改进,给出一种新的支持向量机核函数,并提出一种改进的最小二乘再生核支持向量机的回归模型,该回归模型的参数被减少,且仿真实验结果表明:...
基于python+Flask+Paddle-ERNIE实现的的自动派单系统源码+项目说明.zip
浏览:18
基于python+Flask+Paddle-ERNIE实现的的自动派单系统源码+项目说明.zip 基于fasttext的文本分类 最初的派单项目是使用fasttext实现的文本分类模型实现的一级文本分类任务。在这个任务中,没有层级分类的概念,即各...
[lry]人体运动捕获数据的向量空间建模与检索
浏览:188
然后将运动片段的每一帧都替换成运动词汇中与其最相近的姿势来构建运动文档,利用Bigram向量空间模型对人体运动进行检索.整个算法流程不需要人为干预,能够自动完成对已分割运动数据片段的索引.实验结果表明,与现有...
基于短语的维吾尔文文本分类 (2012年)
浏览:165
在基于向量空间模型(VSM)的文本表示中特征单元粒度的选择直接影响到文本分类的效果。对于基于词袋模型(BOW)的维吾尔文文本分类效果不理想的问题,提出了一种基于统计方法的维吾尔语短语抽取算法并将抽取到的短语作为...
论文研究-基于维基百科的主题特征扩展研究 .pdf
浏览:141
基于维基百科的主题特征扩展研究,曾庆旺,常晓林,文本自动分类是自然语言处理中一个重要的研究方向,其在数据挖掘与信息检索领域中扮演着重要的角色。针对传统向量空间模型特征空
python大作业 含爬虫、数据可视化、地图、报告、及源码(整和为一个文件)(2014-2020全国各地区原油加工量).rar
浏览:198
5星 · 资源好评率100%
(含源码及报告)本程序分析了自2014年到2020年每年我国原油加工的产量,并且分析了2019年全国各地区原油加工量,含饼状图,柱状图,折线图,数据在地图上显示。运行本程序需要requests、bs4、csv、pandas、matplotlib、pyecharts库的支持,如果缺少某库请自行安装后再运行。文件含2个excel表,4个csv文件以及一个名字为render的html文件(需要用浏览器打
仿真电路以及操作方法
浏览:115
5星 · 资源好评率100%
用一片通用四运放芯片LM324组成电路,实现以下功能:用低频信号源产生ui1=0.1sin2πft(V),f=500Hz的正弦波信号,加至加法器的输入端,加法器的另输入端加入有自制振荡器产生的信号uo1。要求加法器的输出电压ui2=10 ui1+ uo1。ui2经选频滤波器滤除uo1频率分量,选出f信号为uo2,uo2为峰峰值等于9V的正弦信号。uo2信号经比较器后在1KΩ负载上得到峰峰值2V的输
【纯干货啊】华为IPD流程管理(完整版).pptx
浏览:169
4星 · 用户满意度95%
华为IPD产品研发流程完整版。非常的详细,很适合给新是的实习生做培训用!是我一直在用的流程管理,很适合学习与交流。
可编程语言标准IEC61131-3中文版.pdf
浏览:19
5星 · 资源好评率100%
可编程语言标准IEC61131-3中文版
OFDM完整仿真过程与教程.zip
浏览:55
5星 · 资源好评率100%
辛苦写了关于OFDM的详细仿真,从产生信息流到最终解调,包含星座图,误码率图。包括了相关技术的详细解释,(信道编码,扩频,导频,信道估计等)。注:本段程序不包括射频传输部分,即载波调制,基带调制为QPSK。具体的教程可以参考我的相关文章。
信号与系统——保研复习资料.pdf
浏览:126
本文档为本人保研复习过程中撰写的信号与系统复习文档,参考书籍为吴大正老师主编的信号与线性系统分析(第四版),全文共43页,包含以下内容: 一、信号与系统(绪论) 二、连续系统的时域分析 三、离散系统的时域分析 四、傅里叶变换和系统的频域分析 五、连续系统的s域分析 六、离散系统的z域分析 七、系统函数 八、少量经典面试题(保研)
Landsat_WRS2.zip
浏览:174
5星 · 资源好评率100%
本资源为WRS2全球条带号分幅情况SHP文件。WRS,即Worldwide Reference System,是Landsat系列卫星全球影像标记符号系统,用以区分全球各区域对应的Landsat系列卫星影像编号;其用“Path”与“Row”两个数值确定影像的编号与位置。其中,Landsat 1、2、3卫星对应编号系统为WRS-1,Landsat 4、5、7、8卫星对应编号系统为WRS-2。WRS-
最全的Visio形状/图形库
浏览:73
从不同地方搜集整理出来的Viso图标,全部文件都是Visio图形库的标准格式:VSS格式,内含有51个文件,分别对应类别。内容比较全面,包括常用图表、服务器图、各种符号图表、工作流程形状、绘制图表形状、网络和外设图、网络位置及物理逻辑图、最常使用的图表、办公室设备图及办公室附属设施图等等。
AxureRP9项目原型50套、案例20个、元件库1套.zip
浏览:2
AxureRP9项目原型50套、案例20个、元件库1套。非原创,其中一批比较好的案例值得参考,元件库直接可用,简洁美观。分享给需要的人。
北理工+成电+东南——通信/信号保研面试真题.pdf
浏览:176
本文档整理了本人在2019年推免过程中,面试老师问到的问题,本文具体包括以下三所院校:北京理工大学雷达技术研究所;电子科技大学泛在无线网络实验室、多维信息感知实验室、图像处理研究所;东南大学移动通信国家重点实验室。对于面试中涉及到的专业课问题,我在面试结束后查阅书籍并给出了个人解答,仅供参考。
数字信号处理——保研复习资料.pdf
浏览:169
本文档为数字信号处理(DSP)复习文档,参考书籍为高西全老师主编的《数字信号处理——原理、实现及应用》第二版,全文共33页,包含以下内容: 一、绪论 二、时域离散信号与系统 三、时域离散信号和系统的频域分析 四、离散傅里叶变换( DFT)及其快速算法( FFT) 五、模拟信号数字处理 六、数字滤波器 七、IIR数字滤波器( IIRDF)设计 八、FIR数字滤波器( FIRDF)设计 九、少量经
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
chris1987
粉丝: 0
资源:
3
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
yolo开发的基础教程
2024年端午节的庆祝代码教程.docx
基于JavaGUI编程的医院病房管理系统
bbbbbbbbbbbbbbb
容器镜像注册表服务harbor安装包
111111111111
anytext,可全文搜索硬盘,侵删
支持GPU挂载kind
烟雾报警.py
拓扑图以及配置啦啦啦啦啦
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功