下载 >  开发技术 >  C > svmcls文本分类程序(含C++源代码+语料库)完整版

svmcls文本分类程序(含C++源代码+语料库)完整版 评分:

svmcls 2.0文本自动分类器支持中文和英文文档,特征选择方式包括全局和按类别选取,概率估算方法支持基于文档(布尔)统计和基于词频统计,支持三种特征加权方式,特征评估函数包括信息增益、互信息、期望交叉熵、X^2统计,文本证据权重,右半信息增益,分类方法包括支持向量机SVM和K近邻KNN,由李荣陆老师于2004年开发完成。 网上流传很多版本的svmcls文本分类程序,但几乎全部都是不能编译通过的,有些是缺少xercesc文件夹,有些是缺少xerces-c_2_2_0D.dll,有些是缺少分词程序和数据导致分词程序初始化失败,还有的缺少直接训练测试的语料库。 本人经过整理和编译测试,保证本压缩包解压后不仅有可以直接使用的.exe程序,而且所包含的源代码可以编译 通过。可供广大学者研究使用。
...展开详情收缩
2010-04-30 上传大小:19.86MB
分享
收藏 (17) 举报

评论 共111条

u035691546 谢谢提供分析,对我很有帮助哦
2017-11-20
回复
lzxiangz 特别好,中英文分类均可
2017-09-29
回复
u011017252 没用上,给个赞
2017-02-23
回复
fall97 的确很完整~
2016-03-14
回复
weigui1991 很详细,还有注释,适合学习
2016-01-05
回复
data_li 为什么总是“分词程序初始化,请稍候... 分词程序初始化结束,耗时00:00:00 开始扫描训练文档,请稍候... ------------------error----------------- 训练文档的总数为0!”这样显示,请楼主帮忙,我的是txt文件
2015-09-09
回复
xuxie_wanmei 不太懂c++,也不知道什么原因没运行起来
2015-08-11
回复
yangacheng 中英文分类均可,语料库是中文的。代码有注释
2015-06-29
回复
qq_25850723 分类结果不显示,提示“试图执行系统不支持”
2015-05-07
回复
beyondzhm 水平有限,没看多懂
2015-05-01
回复
SVMCLS 文本自动分类器(可编译Release完整版)--李荣陆

之前的最好资源描述如下: svmcls 2.0文本自动分类器支持中文和英文文档,特征选择方式包括全局和按类别选取,概率估算方法支持基于文档(布尔)统计和基于词频统计,支持三种特征加权方式,特征评估函数包括信息增益、互信息、期望交叉熵、X^2统计,文本证据权重,右半信息增益,分类方法包括支持向量机SVM和K近邻KNN,由李荣陆老师于2004年开发完成。 网上流传很多版本的svmcls文本分类程序,但几乎全部都是不能编译通过的,有些是缺少xercesc文件夹,有些是缺少xerces-c_2_2_0D.dll,有些是缺少分词程序和数据导致分词程序初始化失败,还有的缺少直接训练测试的语料库。 本人经过

立即下载
搜狗中文文本分析语料库

搜狗实验室新闻数据精简版,将xml文本进行处理后分类如下: 奥运 5595个txt 房产 14695 个txt 互联网 2200个txt 健康 1153个txt 教育 2075个txt 军事 593个txt 旅游 1802个txt 汽车 1405个txt 商业 12465个txt 时尚 3490 个txt 体育 17237 个txt 文化 628个txt 娱乐 6757个txt 招聘 18个txt 由于是个人xml文本处理过的,处理了部分文档,如果需要更多可以联系我。

立即下载
中文文本分类语料(复旦)(完整版

中文文本分类语料(复旦)-训练集和测试集 这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大,下载时请耐心等待。

立即下载
简单文件分类工具

用VB写的一个简单的文件分类程序,含源代码 V1.3

立即下载
中文文本分类语料(复旦)训练集

这个链接是训练集,测试集自己去搜有免费的,明明应该是免费的东西,有几个智障非要收钱,然后我才发现,现在csdn不能免费了?最低是2资源竟然? 分享一个免费的链接链接:https://pan.baidu.com/s/1833mT2rhL6gBMlM0KnmyKg 密码:zyxa 要是想打赏下载那个2c币的也行,谢谢老铁 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国

立即下载
中文文本分类语料(复旦)-测试集下载

这个链接是测试集,训练集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。

立即下载
中文文本分类语料(复旦)训练集+测试集(100M)完整版

中文文本分类语料(复旦)训练集+测试集(100M)完整版

立即下载
搜狗最新文本分类语料库

搜狗最新文本分类语料库 C000007 汽车 C000008 财经 C000010 IT C000013 健康 C000014 体育 C000016 旅游 C000020 教育 C000022 招聘 C000023 文化 C000024 军事

立即下载
sogou中文语料库

相对比较完整的中文语料库,用于中文本分类的训练预料

立即下载
PFR语料库-人民日报

PFR语料库,有词语切分和词性标注,严格按照人民日报的日期、 版序、文章顺序编排。做NLP非常好的一份资源。

立即下载
HowNet 所有数据

包含了hownet的所有数据,具体包括 1. 用于中英文情感分析的语料库 2. mini-hownet 3. 基于hownet的词汇相似度计算数据 4. hownet 英文词汇列表 5. hownet 中文词汇列表 6. HowNet-Chinese Message Structure Bank 7. Event Relations and Role Shifting

立即下载
SVM文本分类程序源码

这是SVM文本分类程序源码,既有java版本,也有C++版本。

立即下载
人民日报2014语料库(全)

人民日报2014语料库, 文件多且大所以整合成了压缩包,需要的下载后解压即可

立即下载
文本分类程序

完整的文本分类程序,分词,去停用词,提取文本特征等。

立即下载
搜狗语料库(已分词)

搜狗语料库,自己用结巴分词分好的。(为什么摘要必须大于50个字)

立即下载
KNN 分类程序 c++

KNN 分类程序 用c++写的kNN分类程序。

立即下载
人民日报语料库-199801-转码UTF8

人民日报1998年1月份的语料库,加入了词性标注,北京大学开发,中文分词统计的好资料,已经转码了

立即下载
人民日报中文分词语料库

网上流传的人民日报1998年1月份的语料库,北京大学开发;处理成了crf分词训练语料的格式;

立即下载
新闻语料库

包含2015年一整年的新闻,文件以txt形式存储,是从各大网站上爬取下来的。希望喜欢

立即下载
中文短文本情感分析语料 外卖评价

短文本情感分析语料,某外卖平台收集的用户评价,正负各8000条,共16000条

立即下载

热点文章

img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

svmcls文本分类程序(含C++源代码+语料库)完整版

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
7 0 0
为了良好体验,不建议使用迅雷下载
VIP和C币套餐优惠
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
您还未下载过该资源
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

  • 举报人:
  • 被举报人:
  • *类型:
    • *投诉人姓名:
    • *投诉人联系方式:
    • *版权证明:
  • *详细原因: