下载 >  开发技术 >  C# > 遗忘算法(词库生成、分词、词权重)演示程序.rar

遗忘算法(词库生成、分词、词权重)演示程序.rar 评分:

遗忘算法演示程序及源码,功能包括词库生成、分词、词权重计算。是CSDN博文《非主流自然语言处理——遗忘算法系列》的配套资源。作者老憨欢迎交流讨论。
2015-11-27 上传大小:35.95MB
分享
收藏 (21) 举报

评论 共34条

xunwapweb 一般般,,,,,,,aaaa啊啊啊啊
2019-05-23
回复
achuanzhou 资源挺好的
2019-04-23
回复
kuangsansama 一般般。没怎么有用。
2018-08-28
回复
heluue 一般般。没怎么有用。
2018-07-03
回复
mengl_ong 非常好评,很好用
2018-06-06
回复
wang_yanbo 非常好评,很好用
2018-05-29
回复
luo454900877 very helpful
2018-05-28
回复
qksr250 very helpful
2018-05-17
回复
ican008 多谢,不错!
2018-04-10
回复
liyonghong402192649 不能打开,什么原因
2018-03-29
回复
中文分词的词库是自己定义的还是怎么弄的?
中文分词:原理及分词算法
遗忘算法词库生成&分词&词权重演示程序(可直接运行)

遗忘算法(词库生成&分词&词权重)演示程序(可直接运行)

立即下载
遗忘算法词库生成分词、词权重演示程序权重计算.zip

遗忘算法(词库生成、分词、词权重)演示程序 词权重计算。 遗忘算法(词库生成、分词、词权重)演示程序。 遗忘算法演示程序及源码,功能包括词库生成、分词、词权重计算。是CSDN博文《非主流自然语言处理——遗忘算法系列》的配套资源。作者老憨欢迎交流讨论。 自然语言处理遗忘算法

立即下载
遗忘算法演示程序(包含词库生成分词、词权重)C#源码详细介绍

遗忘算法演示程序(包含词库生成、分词、词权重)C#源码详细介绍

立即下载
solr搭建(含拼音检索,三种分词器,停词器,扩展词库

solr的基本搭建,拼音检索,三种分词器(smartcn ,IK,mmseg4j)的安装,停词器的安装

立即下载
最新整理 盘古分词 dct词库文件 720592条 24.6M

最新整理 盘古分词 dct词库文件 共720592条数据,文件大小:24.6M

立即下载
新版盘古代码+分词词库+分词工具

新版盘古代码+分词词库+分词工具 Pan Gu Segment is a library that can segment Chinese and English words from sentence. 盘古分词是一个中英文分词组件。作者eaglet 曾经开发过KTDictSeg 中文分词组件,拥有大量用户。 作者基于之前分词组件的开发经验,结合最新的开发技术重新编写了盘古分词组件。

立即下载
30万 中文分词词库

格式: 序号 单词 词频 词性 词性请参考:http://ictclas.org/ictclas_docs_003.html http://hi.baidu.com/drkevinzhang/blog/category/ictclas%B7%D6%B4%CA/index/1 自己做毕设整理的分词词库,使用中科院的标注集合北大标注集,也就是两种标注混合用的。每个词一个词性,也有词频。由于使用多个词典整合的,词频不是特别准。但是能满足一般的需求。 容量为29.8w. 包含了三级地名、名胜、重要山川河流、一万左右的成语。由于一部分词来自搜狗互联网词库,有些词明显是拼写时常连着拼而不是词。对词库要

立即下载
淘宝商品分类词库二十万汉语词汇结巴中文分词词库,可用于商品分类聚类分词

淘宝商品分类词库二十万汉语词汇结巴中文分词词库,可用于商品分类聚类分词, 每行一个词汇 带大分类及小分类编号,经过海量数据实战检验,没有重复词汇,可用于商品分类聚类分词 可直接替换结巴中文分词 词库

立即下载
中文词库(120万带IDF权重)

其于原有20万带IDF权重的词典,经过去重,增加,合并后成了120万; 线上系统正在使用中,非常不错; 后面我会将常用度量的也加上。最终形成超全的词库

立即下载
IKanalyzer约2000个常用停止词库

近期整理的IKAnalyzer中文停用词列表,大约有2000多个词,希望可以帮到大家,下载希望给个好评,谢谢

立即下载
盘古分词字典文件 词库

盘古分词字典文件 词库,将此文件放置于盘古分词根目录,修改PanGu.xml(此文件可以自动生成)文件中<DictionaryPath>Dictionaries</DictionaryPath>此节点的值为Dictionaries即可

立即下载
带词性标注的中文分词词典

人民日报统计出来的用于自然语言处理的中文词典

立即下载
jieba+百度分词词库(60万+)

jieba和百度分词词库;

立即下载
搜狗颜文字词库

搜狗颜文字词库包

立即下载
专业商品词库

商品词库,淘宝专业词库,饰品词库,礼品词库,化妆品词库

立即下载
中文词库带词性标注中文字典

自己统计的一部分词库,附加词性,整理好放在excel可以直接导入数据库

立即下载
淘宝天猫品牌词库(全)

包含淘宝天猫99%的品牌,品牌数量有45万多个,方便用户进行标题分词,品牌词过滤等操作。

立即下载
ik中文分词词库30万中文分词词库(含电商)

ik中文分词词库30万中文分词词库(含电商) ik中文分词词库30万中文分词词库(含电商)

立即下载
img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

遗忘算法(词库生成、分词、词权重)演示程序.rar

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
48 0 0
为了良好体验,不建议使用迅雷下载
VIP和C币套餐优惠
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
您还未下载过该资源
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

  • 举报人:
  • 被举报人:
  • *类型:
    • *投诉人姓名:
    • *投诉人联系方式:
    • *版权证明:
  • *详细原因: