没有合适的资源?快使用搜索试试~
我知道了~
文库首页
课程资源
专业指导
中文词表(可用于分词,53143个词条,全!)
中文词表(可用于分词,53143个词条,全!)
中文词表
5星
· 超过95%的资源
需积分: 42
353 下载量
199 浏览量
2009-03-23
09:32:42
上传
评论
8
收藏
641KB
DIC
举报
温馨提示
立即下载
中文词表,可用于分词,共53143个词条
资源推荐
资源评论
现代汉语词汇表(共38285个).xls
浏览:78
5星 · 资源好评率100%
现代汉语词汇表(共38285个).xls
298032条中文分词词库,分词专用词性词频
浏览:95
4星 · 用户满意度95%
298032条中文分词词库,分词专用词性词频,mdb格式,直接可导入的数据库,格式为id 自增序号、key 中文分词、att词性、num词的频率,用office Access 打开
中文分词词库汇总
浏览:200
4星 · 用户满意度95%
汇总的中文分词词库,分为两个目录: 1、中文分词词库汇总。包含10个词库,文件名字表示里面词的数量(单位是千),如150.txt,表示包含15万词。 2、主流分词工具的词库。包含word/jieba/mmseg/IK分词工具的最近词库。 注意:分词时,不一定是词库中的词越多,效果越好。
中文词库(71万带索引)
浏览:153
中文词库(71万带索引), 自己合并了一些,训练了一些,非常好用
366万常用的中文词汇整理
浏览:98
4星 · 用户满意度95%
作者:刘邵博 此词典为个人综合多本词典整合的一个大词典,词典共有词汇3669216个词汇。 词典结构为:词语\t词性\t词频。 词频是用ansj分词对270G新闻语料进行分词统计词频获得。 部分词汇无法确定是什么词性,对词性进行特别标注:nw和comb 1、词性nw表示本身不知道是什么词性。 2、词性comb表示通过ansj的nlp分词之后又被拆成了两个词。
中文分词最全停用词表
浏览:52
中文最全停用词表
汉语常用词汇大全 一行一个.txt
浏览:164
汉语常用词汇大全 一行一个 合计近5万个 例如 阿爸 阿斗 阿飞 阿胶 阿拉 阿里 阿婆 阿姨 阿谀 埃及 挨边 挨次 挨打 挨到 挨饿 挨个 挨过 挨肩 挨近 挨骂 ......
NLP分词通用词表
浏览:77
相当全的停用词表,含有将近2000个停用词,你值得拥有。。
中文常见的停用词表 TXT文档
浏览:113
5星 · 资源好评率100%
中文常见的停用词表 TXT文档
中文反义词词表-可用于反义词向量
浏览:193
中文反义词词表,包含约7400个反义词组antonym.txt,同时包含词语的注释description.txt,可用于反义词向量的训练,以及词语反义置换。
用于中文分词的中文词库包
浏览:155
5星 · 资源好评率100%
15W以上中文词库,可用于 信息检索 搜索引擎 分词 15W以上中文词库,可用于 信息检索 搜索引擎 分词 15W以上中文词库,可用于 信息检索 搜索引擎 分词
四十万汉语大词库,可用于中文分词
浏览:97
文本文件,四十万汉语大词库 已确认过,每行一个词汇,没有重复词汇,可用于中文分词
财经常用词词库大全,用于中文分词
浏览:42
财经常用词词库大全,用于中文分词,非常全。学习分词、自然语义分析的必备词库。适用于市面绝大部分主流的自然语言处理工具包。
文本分词常用中文停用词表
浏览:11
使用jieba分词时,需要载入停用词表,这四个是常用的停用词表,文件名对应如下: 中文停用词表 cn_stopwords.txt 哈工大停用词表 hit_stopwords.txt 百度停用词表 baidu_stopwords.txt 四川大学机器智能实验室停用词库 scu_stopwords.txt
用于非监督中文分词算法的中文分词词库
浏览:20
3星 · 编辑精心推荐
用于非监督中文分词算法的中文分词词库
中文同义词表.txt
浏览:18
2万多条同义词,已经处理好了,json格式方便程序调用 {"富裕":"富有|敷裕|富饶|富足|充裕|富余|穷苦|贫穷","富有":"富裕".........}
汉语语料库分词类词频表-高频词汇.xls
浏览:59
分类词频是文本分析中非常重要的内容。本资源把常用的分类词收集起来,方便大家在做文本分析时使用。有了本资源,大家可以提高文本分析的效率
最全的中文停用词表20K
浏览:136
5星 · 资源好评率100%
在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。但是,并没有一个明确的停用词表能够适用于所有的工具。甚至有一些工具是明确地避免使用停用词来支持短语搜索的。
结巴jieba分词中文分词停用词表2000条数据
浏览:135
3星 · 编辑精心推荐
结巴中文分词停用表,整合百度分词、哈工大等停用词表2000余条数据 即拿即用,效果好,提升分词速度准确率。
最全中文停用词表(1893个)
浏览:12
常用的中文停用词表,包括了常见的标点符号以及常见的停用词
中文分词词库(TXT格式)
浏览:117
3星 · 编辑精心推荐
中文分词词库,供分词算法使用。。。。。。。。。。。。。。。。。
停用词表.txt
浏览:101
4星 · 用户满意度95%
用于文本数据预处理的去除停用词,每个词以换行的形式分割
结巴分词、词性标注以及停用词过滤
浏览:177
5星 · 资源好评率100%
因为比赛需要用到结巴分词,所以写了一个关于结巴分词、词性标注以及停用词过滤的python程序。
复旦完整版语料库+停用词+精选10类每类100篇+分词过滤
浏览:67
5星 · 资源好评率100%
资料包里面含有完整版的复旦大学语料库,外加上本人针对这个语料库而收集整理的分词表,还包括本人精选10类各100篇,以及对其进行分词后的文件,以及只筛选名词后的文件
中文停用词表.txt
浏览:10
5星 · 资源好评率100%
中文停用词, NLP分词参考,相对比较全的一版
用于临床文本的细粒度中文分词和词性标注语料库
浏览:28
用于临床文本的细粒度中文分词和词性标注语料库
CRF++的使用 CRF用于中文分词-附件资源
浏览:71
CRF++的使用 CRF用于中文分词-附件资源
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
zirobot
2016-01-23
还不会使用,感觉挺全的
thf517
2013-05-09
挺不错的字库, 自己进行了一些处理,把前面的序号删除了,现在,已经在我的实验中用上了
xxc1605629895
2014-03-31
不错,可以拿来做分词
xiaob135
2016-07-06
词库很全,不过都是词典里的,基本没有网络词。
无名之名·
2017-12-28
挺好的,希望还能继续更新
1
2
3
4
5
6
前往
页
zhychg
粉丝: 0
资源:
2
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
Railay - 响应式前端框架
基于Matlab实现扩展卡尔曼滤波EKF源码+超详细注释+项目说明(高分优质项目).zip
第十二章 Pandas 库(jupyter版 人工智能编程基础)
LOL战绩查询工具 - 精准掌握游戏数据
android tv+系统应用
基于Matlab实现扩展卡尔曼滤波(EKF)源码+超详细注释+项目说明.zip
Springer 施普林格 期刊的LaTex模版
Python大作业二手车价格预测案例数据挖掘源码+实验报告+详细注释(95分以上).zip
学籍管理系统:JAVA源码-管理学生相关信息
content_1715678689018.apk
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
- 3
- 4
- 5
- 6
前往页