没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
机器学习
jieba+百度分词词库
jieba+百度分词词库
jieba
NLP
3星
· 超过75%的资源
需积分: 50
172 下载量
193 浏览量
2017-07-13
12:12:34
上传
评论
1
收藏
6.56MB
TXT
举报
温馨提示
立即下载
开通VIP(低至0.43/天)
买1年送1年
jieba与百度的分词词库整合,加入了少量汽车行业的词语,剔除重复项之后剩余630406个词语。
资源推荐
资源评论
python jieba 百度60万+中文分词词库(内含带词性权重词库和不带词性权重词库以及停用词词库)
浏览:154
5星 · 资源好评率100%
文件内包含 jieba 百度60万+分词词库(带词性权重和不带词性权重的文件各一份),附带停用词词库,词性和权重由机器学习等技术手段生成,持续优化中,欢迎私信提供宝贵意见。
jieba分词的自定义词典文档 完整版
浏览:178
5星 · 资源好评率100%
jieba分词的自定义词典:使用jieba分词对语料进行分词之前,需要先载入,载入代码为jieba.load_userdict("userdict.txt")。
jieba 分词
浏览:158
组件只提供jieba.cut 方法用于分词 cut方法接受两个输入参数: 第一个参数为需要分词的字符串 cut_all参数用来控制分词模式 待分词的字符串可以是gbk字符串、utf-8字符串或者unicode jieba.cut返回的结构是一个可迭代的generator,可以使用for循环来获得分词后得到的每一个词语(unicode),也可以用list(jieba.cut(...))转化为
jieba分词工具包下载
浏览:31
python-jieba文件包,解压后将两个文件夹放入 工程文件--->venv(或自定义的配置文件夹)--->Lib--->site-packages中使用
中文分词词库,中文词库20万(19万6千)
浏览:49
5星 · 资源好评率100%
中文分词词库,中文词库20万(19万6千),自己整理的,用于做中文分词,根据一段话,或者一篇文章进行拆词都可以使用的上。
中文分词词库汇总
浏览:93
4星 · 用户满意度95%
汇总的中文分词词库,分为两个目录: 1、中文分词词库汇总。包含10个词库,文件名字表示里面词的数量(单位是千),如150.txt,表示包含15万词。 2、主流分词工具的词库。包含word/jieba/mmseg/IK分词工具的最近词库。 注意:分词时,不一定是词库中的词越多,效果越好。
百度分词词库
浏览:70
4星 · 用户满意度95%
据说是百度分词词库~
百度分词词典——常用词词典 自然语言处理分词专用
浏览:172
百度分词词典——常用词词典 自然语言处理分词专用 能够辅助分词,共1876个词。
jieba百度分词词库
浏览:144
jieba百度分词词库 共63万+条数据
jieba+百度分词词库(60万+)
浏览:196
4星 · 用户满意度95%
jieba和百度分词词库;
jieba词库+百度词库 (2).zip
浏览:23
包含jieba中文分词词库和百度中文分词词库,十分全面完整,总共有六十多万个词
baidu分词词库
浏览:6
4星 · 用户满意度95%
《百度分词词库详解与应用》 在自然语言处理领域,分词是文本预处理的重要环节,它将连续的汉字序列切分成具有语义意义的词汇单元,为后续的语义分析、情感分析等任务奠定基础。百度作为国内领先的搜索引擎公司,其...
jieba分词包
浏览:103
jieba分词包是一款在Python编程语言中广泛使用的开源中文分词库,它的全称是“结巴分词”,由李航(Hankcs)开发并维护。这个名字来源于中文分词的一个常见错误——将“不是”误分作“不”和“是”,形象地反映了...
人工智能_项目实践_分词词库_分词词库(中英文)
浏览:199
5星 · 资源好评率100%
在实际项目中,这些分词词库可以被各种NLP工具或库所使用,例如Python的jieba库用于中文分词,NLTK或Spacy库用于英文分词。"funNLP-master.zip"这个文件很可能是一个包含实用NLP工具或示例代码的资源包,可能提供了...
jieba结巴分词.zip
浏览:152
本篇文章将深入探讨jieba分词的工作原理、主要功能以及实际应用,旨在帮助读者全面理解和掌握这一工具。 首先,我们来理解一下什么是分词。分词,即词语分割,是指将连续的汉字序列按照语义和语法进行切分,将其...
结巴jieba分词中文分词停用词表2000条数据
浏览:101
3星 · 编辑精心推荐
结巴中文分词停用表,整合百度分词、哈工大等停用词表2000余条数据 即拿即用,效果好,提升分词速度准确率。
jieba分词资源包
浏览:65
5星 · 资源好评率100%
结巴分词用到的资源文件,使用方式见博客
jieba分词器字典
浏览:149
4星 · 用户满意度95%
jieba分词器所用的字典,包含词频以及词性,可自行调整频次等属性。(仅做学习交流用,禁止商用)
jieba分词词典大全dict.rar
浏览:74
5星 · 资源好评率100%
自己搜集来的词典,有重复的一些,自己甄别,里面包了清华大学词典,台湾大学词典,知网词典等,褒义词,贬义词,情感词一类的,反正挺多的
jieba分词词典和停用词
浏览:36
利用jieba分词进行文本的处理这里面是jieba分词所需要的词典和停用词
分词词库_中文分词词库最新整理(TXT格式)
浏览:162
分词词库_中文分词词库最新整理(TXT格式)
中文分词词库整理.rar
浏览:111
5星 · 资源好评率100%
30万 中文分词词库,42537条伪原创词库,dict.txt,fingerDic.txt,httpcws_dict.txt,out.txt,百度分词词库.txt,词库地址.txt,词库下载地址.txt,四十万汉语大词库.txt,四十万可用搜狗txt词库.txt,搜狗词库方法.txt,五笔词库.TXT 解压密码为:www.5eyi.com 想省资源分可以到http://www.5eyi.com/d
Python Jieba中文分词工具实现分词功能
浏览:95
Python Jieba中文分词工具实现分词功能,Python Jieba中文分词工具实现分词功能
jieba分词jar包
浏览:82
该文件是jieba分词jar包,其中包括主要的jar包,源码,文档等。
结巴中文分词.zip
浏览:91
结巴中文分词.zip,结巴中文分词
百度中文分词词库
浏览:68
4星 · 用户满意度95%
中文分词是中文搜索引擎重要的一部分,分词词库为基于词典分词的中文分词算法提供了分词的依据。
评论
收藏
内容反馈
立即下载
开通VIP(低至0.43/天)
买1年送1年
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
rocwoods
2017-10-15
很不错,词典还算丰富。
95359
2018-04-02
词汇量高达60w+,没有词性 其他其他信息。 包括了一些繁体字的重复就
kingeboy
2017-11-29
可惜不带词性和词频
neoson2015
2017-11-03
一般般,没有想象中好
gulangduhu
2018-03-20
一般般,不带词性和词频
1
2
前往
页
lingduo24
粉丝: 6
资源:
3
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
中国省市县-夜间灯光数据.xlsx
Python-Tkinter-跳动的心-理科生的浪漫
工作学习资料bin-pe分支20241114-GIT02
Screenshot_2024-11-14-10-03-42-04.jpg
jw_demo2.ipynb
QMLQML多线程应用(WorkerScript)
JAVA poi按模板导出excel数据时列合并问题
个人数据库开发学习整理的课程考试总结,分享给有需要的人,仅供参考
个人软考冲刺整理的课程考试总结,分享给有需要的人,仅供参考
工作学习资料bin-pe分支20241114
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
前往页