已选条件 :  
img
机器学习文本分类训练集

机器学习文本分类训练集,用于机器学习算法的训练。复旦大学

img
基于贝叶斯及KNN算法的newsgroup文本分类器免积分下载版

基于贝叶斯及KNN算法的newsgroup文本分类器,eclipse工程,免积分下载版 程序运行方法:用eclipse打开工程,并将newsgroup文档集解压到 F:\DataMiningSample\orginSample目录下,同时在F:\DataMiningSample\ 下建好如附件“F盘DataMiningSample目录下的数据子目录结构”图中的目录, 停用词表也放在"F:/

img
中文文本分类中的特征选择算法研究

中文文本分类中的特征选择算法研究 中文文本分类中的特征选择算法研究

img
数据挖掘:基于朴素贝叶斯定理的文本分类实践(Java)

数据挖掘:基于朴素贝叶斯定理的文本分类实践(Java)

img
classification文本分类工具包

该工具包包含了完整的文本分类流程,涉及分词、特征处理、模型训练、未知样本分类等,是初级文本分类必备工具包

img
文本分类测试集

器学习文本分类 测试集,用于机器学习算法的测试。复旦大学

img
文本分类算法的比较研究

本文通过对Bayes、KNN、SVM应用于中文文本分类进行比较实验研究。应用ICTCLAS对中文文档进行分词,在大维数,多数据情况下应用TFIDF进行特征选择,并同时利用它实现了对特征项进行加权处理,使文本库中的每个文本具有统一的、可处理的结构模型。然后通过三类分类算法实现了对权值数据进行训练和分类。

img
中文文本分类技术的研究

文本分类技术是文本挖掘的核心,本文简单介绍了该研究热点的研究动态、定义并针对其系统结构给出了一个简要 的概述,然后分析了文本分类处理过程中的关键技术,最后对依然存在的某些问题进行了展望。

img
中文文本分类实验

中文文本分类完整流程的简单实现,分词、去停用词、提取特征、计算文档的特征向量、支持向量机训练、测试文档分类,简单实现,其中词频统计、去停用词使用布隆过滤器加速,效果不错

img
用于文本分类的语料库

分为10个类大概2000篇多文本,可用于文本分类的语料库