下载 >  课程资源 >  专业指导 > 一个简单的分词词典,供大家学习测试分词之用。

一个简单的分词词典,供大家学习测试分词之用。 评分:

一个简单的分词词典,供大家学习测试分词之用。
2008-12-08 上传大小:1.66MB
分享
收藏 (3) 举报
基于词典简单分词算法(Java)

基于词典的最大正向/方向匹配算法的JAVA实现,附带Demo窗体和人民日报语料库。

立即下载
中文分词词库

分词词库字典,主要为百度中文分词,主要用于中文jieba分词的自定义词典,或者其他分词工具的自定义词典等。

立即下载
分词中文停止词词典

分词 中文 停止词 词典 分词 中文 停止词 词典 分词 中文 停止词 词典 分词 中文 停止词 词典

立即下载
结巴分词中一部分自定义字典

本人在使用jieba分词做项目时,锁整理出来的一部分被切分的词

立即下载
中文分词词库(TXT格式)

中文分词词库,供分词算法使用。。。。。。。。。。。。。。。。。

立即下载
中文分词字典

中文分词词库,格式如下: 00000001 李 168 n 00000002 李浩 133 nr2 00000003 互联网式 121 b ...

立即下载
中文地名分词+地名词典创建工具

学习了部分分词原理和方法,做了相应的改进: 1、创建了两种词典树,做了性能上的比较 2、改进数字词组的分词方法,加入语法的判断 3、提供地名词典创建工具。将地名全名词典分词获得分词后的地名词典,减少词条数目,增加查找速度。程序用一个中等省会城市测试,模糊查询和精确查询效果都不错。 4、加入地名输入提示的工具。 代码采用C#,为学习成果,尚有很多不完善地方,欢迎交流。 词典数据来源于网络!

立即下载
盘古分词字典文件 词库

盘古分词字典文件 词库,将此文件放置于盘古分词根目录,修改PanGu.xml(此文件可以自动生成)文件中<DictionaryPath>Dictionaries</DictionaryPath>此节点的值为Dictionaries即可

立即下载
30万 中文分词词库

格式: 序号 单词 词频 词性 词性请参考:http://ictclas.org/ictclas_docs_003.html http://hi.baidu.com/drkevinzhang/blog/category/ictclas%B7%D6%B4%CA/index/1 自己做毕设整理的分词词库,使用中科院的标注集合北大标注集,也就是两种标注混合用的。每个词一个词性,也有词频。由于使用多个词典整合的,词频不是特别准。但是能满足一般的需求。 容量为29.8w. 包含了三级地名、名胜、重要山川河流、一万左右的成语。由于一部分词来自搜狗互联网词库,有些词明显是拼写时常连着拼而不是词。对词库要

立即下载
jieba分词的自定义词典

jieba分词的自定义词典:使用jieba分词对语料进行分词之前,需要先载入,载入代码为jieba.load_userdict("userdict.txt")。

立即下载
jieba+百度分词词库

jieba与百度的分词词库整合,加入了少量汽车行业的词语,剔除重复项之后剩余630406个词语。

立即下载
【深度学习语料库】常见金融领域词汇词典

金融方面的常见词汇形成的词典/语料库,jieba.load_userdict()即可使用

立即下载
中文分词词典(按长度分为2/3/4/5四个文件)

中文分词词典。按照长度分成2/3/4/5四个文件,剔除稀有冷门的词,适合常规的项目开发使用。本人项目中就在使用。好用不贵!

立即下载
最新整理 盘古分词 dct词库文件 720592条 24.6M

最新整理 盘古分词 dct词库文件 共720592条数据,文件大小:24.6M

立即下载
Java中文分词

JAVA中maven的使用,中文分词,以及了解协同过滤算法如何做词频分析

立即下载
jieba+百度分词词库(60万+)

jieba和百度分词词库;

立即下载
jieba分词器字典

jieba分词器所用的字典,包含词频以及词性,可自行调整频次等属性。(仅做学习交流用,禁止商用)

立即下载
JAVA版本,每秒约10万汉字,基于词典的中文纯文本分词程序

java版本基于词典匹配,速度为每秒约10万个汉字,本人测试。同时生成倒排索引,倒排索引包含了对于分词的相关信息,如词频。若有Bug可与我联系。

立即下载
带词性标注的中文分词词典

人民日报统计出来的用于自然语言处理的中文词典

立即下载
最新中文分词工具的词库

包括4款分词工具的最新词库: 1、IK分词:27万词 2、jieba分词:40万词 3、mmseg分词:15万词 4、word分词:64万词

立即下载

热点文章

img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

一个简单的分词词典,供大家学习测试分词之用。

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
3 0 0
为了良好体验,不建议使用迅雷下载
VIP和C币套餐优惠
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
您还未下载过该资源
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

  • 举报人:
  • 被举报人:
  • *类型:
    • *投诉人姓名:
    • *投诉人联系方式:
    • *版权证明:
  • *详细原因: