没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
深度学习
stopwords-1.txt
stopwords-1.txt
人工智能
NLP
需积分: 18
100 浏览量
2021-12-30
09:04:22
上传
评论
收藏
19KB
TXT
举报
立即下载
开通VIP(低至0.43/天)
买1年赠1年
身份认证 购VIP最低享 7 折!
领优惠券(最高得80元)
停用词表
资源推荐
资源评论
stopwords.txt
中文停用词表,共3185个停用词,该列表是本人搜集了网上目前比较热门的中文停用词表然后去重后又根据自己的实际业务人工添加了三四百个停用词得到的。
stopwords.TXT(中英版)
中英文词的停用词表,可以作为中英文信息处理中停用词删除的索引词典使用。 本停用词汇是本人总结了网上以及在文本分类工程提取的stopwords的汇总。 持续更新
stopwords_all.txt.zip
1、内容综合了多套停用词表,如:百度停用词表等; 2、共计2318个停用词; 3、文件类型为txt。
机器学习算法中自然语言处理常用数据集(新闻数据集news.csv)及jieba_dict字典、停用词等相关文件
机器学习算法中自然语言处理常用数据集(新闻数据集news.csv)及jieba_dict字典、停用词等相关文件,包括以下文件 data/news.csv jieba_dict/dict.txt.big jieba_dict/stopwords.txt jieba_dict/stopwords_s.txt
中文分词工具word-1.0,Java实现的中文分词组件多种基于词典的分词算法
5星 · 资源好评率100%
d:/stopwords_more.txt,d:/STOPWORDS_DIR,d:/STOPWORDS2_DIR,stopwords_dir,remove.txt 8、显式指定分词算法 对文本进行分词时,可显式指定特定的分词算法,如: WordSegmenter.seg("APDPlat应用级产品开发平台...
项目实战-朴素贝叶斯算法实现新闻分类源码及数据集.zip
5星 · 资源好评率100%
1、内容概要:本资源主要基朴素贝叶斯算法实现新闻分类,适用于初学者学习文本分类使用。 2、新闻分类源码实现过程...停用词文件stopwords_cn.txt;Naive_Bay.py 朴素贝叶斯算法实现源码;News_NB.py新闻分类实现源码。
kb2vec:向量化知识库以进行实体链接
pip install -r requirements.txt python -m nltk.downloader stopwords python -m nltk.downloader punkt python -m nltk.downloader averaged_perceptron_tagger 下载data文件夹并解压缩: wget ...
信息检索 倒排索引
4星 · 用户满意度95%
编写程序实现为给定目录下txt文件建立倒排索引文件il.txt 运行后会自动生成 1.txt,2.txt,4.txt,其中 1.txt,2.txt需要你自己输入需要排序的文档(如莎士比亚的文集),排序结果输出在il.txt中
自然语言处理第九章文本情感分析PPT实训项目
stopwords.txt,pos.txt,neg.txt,comment.csv,BosonNLP_sentiment_score.txt,workspace.xml,modules.xml,misc.xml,.gitignore,第9章.iml,inspectionProfiles,第9章 文本情感分析.pptx,1. 实验项目: ①...
项目实战-朴素贝叶斯算法实现垃圾邮件过滤源码及数据集.zip
5星 · 资源好评率100%
1、内容概要:本资源主要基朴素贝叶斯算法实现垃圾邮件过滤分类,适用于初学者学习文本分类使用。 2、主要内容:邮件数据集email,email文件夹下有两个文件夹ham和spam,其中ham文件夹下的txt文件为正常邮件,spam...
词频统计_M?n_C语言_
5星 · 资源好评率100%
所提供的字典“dictionary.txt”文件和英文停用词表“stopwords.txt”文件2. 分别取两个文本文件中出现频率最高的前N个单词。假设两个文本文件中出现频率最高的前N个单词中有M个单词相同,分别计算这M个单词在两个...
stopwords.txt 2018年新最版,只要2积分
4星 · 用户满意度95%
stopwords,分享给大家,网上下载的地方不多,文件有18K大小
最全中英文停用词(stopwords.txt)【3600字符】
例如:㉡㉢㉣㉤㉥㉦㉧㉨㉩㉪㉫㉬㉭㉮㉯㉰㉱㉲㉳㉴㉵㉶㉷㉸㉹㉺㉻㈀㈁㈂㈃㈄㈅㈆㈇㈈㈉㈊㈋㈌㈍㈎㈏㈐㈑㈒㈓㈔㈕㈖㈗㈘㈙㈚㈛АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдеёжзийклмнопрстуфхцчшщъыьэюя┌┬┐┏┳┓╔╦╗╭─╮├┼┤┣╋┫╠╬╣│╳┃└┴┘┗┻┛╚╩╝╰━╯┍┑┎┒╒╕╓╖╱╲┄┅┕┙┖┚╘╛╙╜╲╱┆┇┝┞┟┠┡┢═ 中英文停用词,在
基于10000网页python搭建搜索引擎课程设计
5星 · 资源好评率100%
10000网页简单上手,代码和配置环境全部写好,傻瓜式操作。 执行文件顺序是 1.Spider.py进行爬取网页并分析 2.index.py生成倒排索引,idf文件 3.app.py运行搜索引擎 ...还需要停用词是stopwords.txt
已整理 停用词表 符号、英文、中文应删除词集合
5星 · 资源好评率100%
1、符号stopWord.txt (1KB) 2、英文stopWord.txt (3KB) 3、中文stopWord.txt (8KB) 4、集合stopWord.txt (11KB) 其中第四个文档是前三个文档的集合。 此是本人实验过程中搜集整理的结果(以前的老版本加上自己整合的...
query-modification:一种信息检索系统,利用用户提供的相关性反馈来改进 Bing 返回的搜索结果
查询修改 一种信息检索系统,它利用用户...6) stopwords.txt 7) org-apache-commons-codec.jar Automation Tools ============================== 8) run.sh 9) makefile Test Results & Documentation =============
项目实战-Bert文本分类(keras-bert实现)源代码及数据集.zip
5星 · 资源好评率100%
2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明...
Spamfilter:垃圾邮件过滤器
垃圾邮件过滤器 垃圾邮件过滤器:基于朴素贝叶斯和逻辑回归将电子邮件分类为垃圾邮件或火腿 如何运行这个?... 参数 0 - 包含 test + train 文件夹 + SpamWords.txt 的文件夹 参数 1 - 是或否表示是否考虑
评论
收藏
内容反馈
立即下载
开通VIP(低至0.43/天)
买1年赠1年
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
Abro.
粉丝: 396
资源:
42
私信
前往需求广场,查看用户热搜
上传资源 快速赚钱
我的内容管理
收起
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
会员权益专享
图片转文字
PDF转文字
PDF转Word
PDF加水印
全年可省5,000元
立即开通
最新资源
基于JSP的网上书店系统的设计与实现(源码+论文)
GPT-4是通用人工智能,又是通用技术
网页html实现时钟效果
VOC格式数据增强,可以按照自己的需求进行增加
CSS完全参考手册.chm
更强的GPT-4,更封闭的OpenAI
SpringBoot命令行JSON属性多行配置
全国城市距离数据.csv
OpenAI核心研发人员:我们如何开发ChatGPT
projectdemotest
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功