没有合适的资源?快使用搜索试试~
我知道了~
文库首页
后端
Python
停止词 stopwords
停止词 stopwords
;stopwords
需积分: 50
9 下载量
121 浏览量
2018-01-28
22:19:46
上传
评论
收藏
20KB
TXT
举报
温馨提示
立即下载
写豆瓣评论爬虫用的停止词,基本上与网上大部分资源相近。
资源推荐
资源评论
中文 停止词 stopwords
浏览:139
中文 停止词 stopwords 中文 停止词 stopwords 中文 停止词 stopwords
stopwords,停用词
浏览:155
Python爬虫常用stopwords,用于整合爬取的数据工具 停用词
(中文)stop word
浏览:41
4星 · 用户满意度95%
许多文本处理系统都有过滤停用词(stop word)这道工序,把对文本信息内容不起作用的高频词过滤。停用词策略能节省存储,提高分类和统计准确度,减少运算量。
中文停用词 stopwords
浏览:166
最近在学TF-IDF关键词提取,用到了停用词,自己又稍微加了几个词,希望对大家有用
stopwords中文停用词
浏览:161
stopwords中文停用词,常用于网络爬虫抓取数据后进行数据整合,纯中文
中文停用词表.txt
浏览:99
5星 · 资源好评率100%
中文停用词, NLP分词参考,相对比较全的一版
数据分析中最全停用词之stopword
浏览:86
该文档内有已经总结好的所有常见停用词,适用于数据分析、数据挖掘方面,尤其是分析用户情感、拆分用户评论、商品评价等方面,对于去除数据的冗余性有很大的作用,可与jieba库一起使用
中文停用词表 stopwords.txt
浏览:189
5星 · 资源好评率100%
简体中文停用词表,可以作为词云的数据清理用。里面的词在任何场景中都是高频词,并且没有实际的含义,在应用词云分析前应进行清除。
stopwords.TXT(中英版)
浏览:33
中英文词的停用词表,可以作为中英文信息处理中停用词删除的索引词典使用。 本停用词汇是本人总结了网上以及在文本分类工程提取的stopwords的汇总。 持续更新
stopwords.txt
浏览:165
stopwords,停用词
中文分词停用词StopWords
浏览:195
中文分词中常用的停用词StopWords集合。
stop_words .txt
浏览:49
中文停用词表,内有一千八百多个停用词,这个比较全,很好用
中文stopwords
浏览:99
自己在python中用的停用词表,每行一个词,无词性
stopwords.zip
浏览:51
四川大学机器智能实验室停用词库,哈工大停用词表,中文停用词表,百度停用词表
boston.zip
浏览:167
房价数据么。因为kaggle下载慢的可以通过这个直接下载。我写这么多只是想凑齐要求的字数哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈
比较全的IKAnalyzer分词器中文停用词 stopwords.dic
浏览:63
内容直接拷贝进stopword.dic即可使用(2614行常用停用词包含中英文,符号等)
停用词表stopwords
浏览:169
5星 · 资源好评率100%
文本分析--停用词集合(结合哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表等)http://blog.csdn.net/kevinelstri/article/details/70227981
分词中文停止词词典
浏览:180
分词 中文 停止词 词典 分词 中文 停止词 词典 分词 中文 停止词 词典 分词 中文 停止词 词典
stopwords-master.zip
浏览:196
很全的中文停用词:哈工大、四川大学人工智能实验室、百度的。GitHub上有,免费的,是一个很优秀的人收藏的,我只是老告诉大家,毕竟我也找了好久可以免费下的。
NLP 停用词表 stopwords(1286个)
浏览:55
4星 · 用户满意度95%
NLP 整合后的停用词表 总共含1286个词
English stopwords list
浏览:93
Christopher Fox1989的论文 A stop list for general text中列出的stopwords list(278个)txt格式
IK-Analyzer 分词器所需要的配置文件、扩展词典及停用词词典 完整包下载
浏览:83
3星 · 编辑精心推荐
IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。 采用了特有的“正向迭代最细粒度切分算法”,具有60万字/秒的高速处理能力。 采用了多子处理器分析模式,支持:英文字母(IP地址、Email、URL)、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理。 Linux下Solr4.10.4搜索引擎的安装与部署图文
常见停用词词典
浏览:110
包含常见的停用词(包括英文通用词)。在做NLP时,停用词过滤可以用。
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
该博客已停用
粉丝: 135
资源:
1
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
word文档.docx
MalodyV_6.0.0_228.apk
Screenshot_20240429_005232.jpg
Screenshot_20240429_005254.jpg
com.finditmario.ume.u1303182022531.apk
森之国度辅助_v1.1.2.apk
柯尔克孜文和西里尔文转换工具
main.c
易优 职称证书在线查询系统-自动生成二维码 下载 Eyoucms插件
基于java记账管理系统.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功