下载 >  移动开发 >  Android > 文本分类之词频统计(分词、词干提取、去停用词、计算词频,有界面

文本分类之词频统计(分词、词干提取、去停用词、计算词频,有界面 评分:

主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
2018-04-15 上传大小:70KB
分享
收藏 举报

评论 共1条

weixin_42306978 假资料,居然是08年的
2018-05-25
回复
文本分类词频统计分词词干提取、去停用词计算词频,有界面

主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用亲测可用, 谢谢支持。

立即下载
java lucene 实现分词和词干抽取

用java实现的,利用了lucene里面的standardAnalyzer分析器实现的分词,可以去停用词,再利用波特算法实现 词干提取 最后排序 和词频统计输出

立即下载
中文高效分词和去停用词特殊符号java源码eclipse 工程

整合 使用ICTCLAS2013(NlPIR) x64 的中文分词,分词的速度和效果都不错。然后就是对文本进行的去停用词以及特殊符号(哈工大停用词库)的去除,这些特殊符号还有标点符号,以及文本中夹杂的数字和字母会对分词的效果产生影响。eclipse GBK 编码

立即下载
中文文本分类实验

中文文本分类完整流程的简单实现,分词、去停用词、提取特征、计算文档的特征向量、支持向量机训练、测试文档分类,简单实现,其中词频统计、去停用词使用布隆过滤器加速,效果不错

立即下载
分词系统常用中英文停用词

在开发分词系统的时候常用的中英文停用词词表,可以用来去掉分词结果中的停用词,常见的的分词系统可以使用结巴分词或者中科院的NLPIR。

立即下载
jieba分词词典和停用词

利用jieba分词进行文本的处理这里面是jieba分词所需要的词典和停用词

立即下载
英文文本词根还原+去停用词小工具

英文文本词根还原+去停用词小工具,非常好用

立即下载
中科院NLPIR最新版分词(2018.10)系统加入用户词典和去除停用词的完整代码

在最新版的中科分词系统基础上,进行了改进,加入用户词典和停用词,并进行文件无乱码读写,输出分词结果,效果不错,是情感分析的良好基础。这一部分,我用来写作为硕士论文的数据处理基础。在此分享给各位,欢迎指教

立即下载
结巴分词、词性标注以及停用词过滤

因为比赛需要用到结巴分词,所以写了一个关于结巴分词、词性标注以及停用词过滤的python程序。

立即下载
最新最全中文停用词,标点-已分词

2018最新最全中文停用词标,标点-已分词。包含哈工大,百度等在用的停用词

立即下载
中文分词用统计词频词典,一词一行

中文分词用统计词频词典,一词一行,txt文本保存

立即下载
统计词频,和对文档进行分词处理,计算tf-idf值。

统计词频,和对文档进行分词处理,计算tf-idf值。

立即下载
湖师贴吧标题词频统计

湖师贴吧标题词频统计表,包含对所有帖子标题分词并去除停用词后的词语的词频统计,共7134条记录。

立即下载
文本分类程序源代码

vc编写的文本分类源代码

立即下载
中文文本分类用词1208个

中文文本分类停用词1208个中文文本分类停用词1208个中文文本分类停用词1208个

立即下载
中文分词最全停用词

中文最全停用词表

立即下载
中科院分词工具

Readme 欢迎使用汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System) 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。 访问我们

立即下载
【2018年9月整理优化】中英文停用词合集(内含哈工大、四川人智能实验室、百度停用词等)

搜索下载了各种中英文停用词(哈工大、百度、四川人工智能实验室等等),最终整理优化了一个合集,供项目使用

立即下载
用Trie树实现词频统计和单词查询

一个简单的C语言程序:用Trie树实现词频统计和单词查询

立即下载
R语言做词频分析

用r语言做词频分析,使用的是mix混合模型 library(jiebaR) library(wordcloud) text<-scan('C:\\Users\\gk01\\Desktop\\1.txt',what='') mixseg <- worker() seg <- mixseg[text]

立即下载
--> -->
img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

文本分类之词频统计(分词、词干提取、去停用词、计算词频,有界面

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
3 0 0
为了良好体验,不建议使用迅雷下载
VIP和C币套餐优惠
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
您还未下载过该资源
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

若举报审核通过,可返还被扣除的积分

  • 举报人:
  • 被举报人:
  • *类型:
    • *投诉人姓名:
    • *投诉人联系方式:
    • *版权证明:
  • *详细原因: