没有合适的资源?快使用搜索试试~
我知道了~
文库首页
后端
Java
纯文本词典 中文分词 分词文本 文本词典
纯文本词典 中文分词 分词文本 文本词典
文本词典
中文分词
分词文本
4星
· 超过85%的资源
需积分: 19
52 下载量
123 浏览量
2009-06-15
16:08:35
上传
评论
2
收藏
1.64MB
TXT
举报
温馨提示
立即下载
文本词典 中文分词 分词文本 纯文本词典 中文分词 分词文本 文本词典 信息检索
资源推荐
资源评论
中文分词字典
浏览:177
5星 · 资源好评率100%
中文分词词库,格式如下: 00000001 李 168 n 00000002 李浩 133 nr2 00000003 互联网式 121 b ...
中文分词词库
浏览:140
4星 · 用户满意度95%
中文分词词库中文分词词库中文分词词库中文分词词库中文分词词库
用于中文分词的中文词库包
浏览:108
5星 · 资源好评率100%
15W以上中文词库,可用于 信息检索 搜索引擎 分词 15W以上中文词库,可用于 信息检索 搜索引擎 分词 15W以上中文词库,可用于 信息检索 搜索引擎 分词
中文分词词库汇总
浏览:108
4星 · 用户满意度95%
汇总的中文分词词库,分为两个目录: 1、中文分词词库汇总。包含10个词库,文件名字表示里面词的数量(单位是千),如150.txt,表示包含15万词。 2、主流分词工具的词库。包含word/jieba/mmseg/IK分词工具的最近词库。 注意:分词时,不一定是词库中的词越多,效果越好。
中文分词词库,中文词库20万(19万6千)
浏览:14
5星 · 资源好评率100%
中文分词词库,中文词库20万(19万6千),自己整理的,用于做中文分词,根据一段话,或者一篇文章进行拆词都可以使用的上。
中文分词词库大全词库
浏览:39
3星 · 编辑精心推荐
这是前一段时间我在研究中文分词时在网上找到的一个词典,TXT格式的,拿出来分享一下。这是前一段时间我在研究中文分词时在网上找到的一个词典,TXT格式的,拿出来分享一下。这是前一段时间我在研究中文分词时在网上找到的一个词典,TXT格式的,拿出来分享一下。这是前一段时间我在研究中文分词时在网上找到的一个词典,TXT格式的,拿出来分享一下。
分词词库_中文分词词库最新整理(TXT格式)
浏览:134
分词词库_中文分词词库最新整理(TXT格式)
中文分词工具word-1.0,Java实现的中文分词组件多种基于词典的分词算法
浏览:184
5星 · 资源好评率100%
word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。 同时提供了Lucene、Solr、ElasticSearch插件。 分词使用方法: 1、快速体验 运行项目根目录下的脚本demo-word.bat可以快速体验分词效果 用法: command [tex
中文分词词典UserDict.txt
浏览:121
在使用jiba分词的情况下,使用这个词典有助于提高你的分词准确度,因为这个分词词典包含了众多领域词汇,这些词汇出自某dog的几十个细胞词库。已使用转换器转换成txt,欢迎下载。
中文分词词典
浏览:109
含有43万条非重复语料
中文分词用的词典文件
浏览:58
5星 · 资源好评率100%
花了几天从各大名牌分词软件中提出的中文词组,已经对词组进行了整理和排序,保存成了三个txt文件,精简:74248个词组、常用:118021个词组、全部:222685个词组、常用标点符号文件共四个文件。
JAVA版本,每秒约10万汉字,基于词典的中文纯文本分词程序
浏览:120
4星 · 用户满意度95%
java版本基于词典匹配,速度为每秒约10万个汉字,本人测试。同时生成倒排索引,倒排索引包含了对于分词的相关信息,如词频。若有Bug可与我联系。
SCWS简体中文分词辞典txt格式
浏览:159
5星 · 资源好评率100%
这是我在研究中文分词时找到的一个辞典。感谢hightman的基础工作。==============================================SCWS-1.x.x 自述文件 (Written by hightman)HomePage: http://www.hightman.cn...[SCWS 简介]SCWS 是 Simple Chinese Words Segmentati
百度分词词库
浏览:70
4星 · 用户满意度95%
据说是百度分词词库~
搜狗中文分词词库下载
浏览:10
4星 · 用户满意度95%
15万条词语, 对需要做搜索的人会有一定帮助。
中文分词词库整理.rar
浏览:10
5星 · 资源好评率100%
30万 中文分词词库,42537条伪原创词库,dict.txt,fingerDic.txt,httpcws_dict.txt,out.txt,百度分词词库.txt,词库地址.txt,词库下载地址.txt,四十万汉语大词库.txt,四十万可用搜狗txt词库.txt,搜狗词库方法.txt,五笔词库.TXT 解压密码为:www.5eyi.com 想省资源分可以到http://www.5eyi.com/d
分词大词库,共366万,普通情况下,足够用
浏览:38
3星 · 编辑精心推荐
分词大词库,共366万,普通情况下,足够用。这是我在做分词项目时,足足找了3天才找到的上等资源。比起那些弄点资源然后收5C币要强得多。
jieba+百度分词词库
浏览:164
3星 · 编辑精心推荐
jieba与百度的分词词库整合,加入了少量汽车行业的词语,剔除重复项之后剩余630406个词语。
搜狗分类词库(2016)
浏览:128
4星 · 用户满意度95%
词库的各分类数据(已去重)来源于搜狗,考虑到各行各业需要的分词规则不同,故没有合并,需要的可以下载下来自行合并
搜狗分类词库(2018)
浏览:110
4星 · 用户满意度95%
2016年上传过搜狗12个分类词库,两年没更新了,今天用程序重新跑了下数据获取到2018最新的数据,导出为txt格式,方便大家做分词用,我不生成词,我只是词的搬运工,版权归搜狗公司所有。
最新中文分词工具的词库
浏览:20
5星 · 资源好评率100%
包括4款分词工具的最新词库: 1、IK分词:27万词 2、jieba分词:40万词 3、mmseg分词:15万词 4、word分词:64万词
带词性标注的中文分词词典
浏览:170
人民日报统计出来的用于自然语言处理的中文词典
文本分词词典 分词 搜索引擎
浏览:2
最近在学搜索引擎。希望对大家有用。 看一下吧。 我还传了另外的分词方法。
baidu.rar_ baidu_dictionary_中文分词_中文分词 词典_分词词典
浏览:55
百度以前用的中文分词词典,希望对大家有一点帮助
中文分词代码及词典(同博客代码)
浏览:42
中文分词源代码,java语言。以及词典txt文本。代码通过读词典获取数据,进行中文分词。将词典读取的数据利用map去重,然后进行前缀扫面,详情见博客:https://blog.csdn.net/qq_40142391/article/details/82945556#commentsedit
基于词典的中文分词算法研究
浏览:145
最近在研究中文分词,非常好用的论文,很详细,透彻。免费供给大家。
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
lara_croft_china
2015-07-24
感觉词库质量一般,不能满足需要啊
dian729506189
2012-04-13
属于最简单最基础的!应对毕业设计是明显不够的!
annane
2012-05-07
词都很旧啊···后面添加的也很乱
behappy373
粉丝: 11
资源:
4
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
字节跳动青训营-抖音项目
SQL资料手册,语句教程,高级查询语句语法
上位机和串口建立 Modbus 协议进行数据传输,并使用 Mysql 数据库存储,能够实现实时温湿度显示和动态变化曲线,历史数据
Attachment 1_chazhi.xlsx
安卓项目,实现虚拟摇杆通过wifi串口发送nema-0183协议实现小吊舱方向控制
基于modbus协议的大屏数据监控,使用modbus slave模拟数据,串口服务器获取温湿度
下载资源.zip
华为防火墙高级培训课件
matlab与通信仿真期末突击教程完整版
Python数据分析教程的资料含实例源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功