hadoop-snappy-0.0.1-lib-linux64+32
hadoop-snappy-0.0.1-lib-linux64+32 hadoop中使用snappy算法,需要手工编译hadoop-snappy的包,但是这个包没有提供下载,需要花很大力气进行编译。 此zip包中包括64位和32位的jar包。
hadoop-snappy-0.0.1-lib-linux64+32 hadoop中使用snappy算法,需要手工编译hadoop-snappy的包,但是这个包没有提供下载,需要花很大力气进行编译。 此zip包中包括64位和32位的jar包。
NaiveBayesClassify朴素贝叶斯分类法-MapReduce实现 朴树贝叶斯分类算法MapReduce实现
30万 中文分词词库,42537条伪原创词库,dict.txt,fingerDic.txt,httpcws_dict.txt,out.txt,百度分词词库.txt,词库地址.txt,词库下载地址.txt,四十万汉语大词库.txt,四十万可用搜狗txt词库.txt,搜狗词库方法.txt,五笔词库.TXT 解压密码为:www.5eyi.com
介绍了词性标注系统的设计与实现,描述了该系统的功能和总体结构,系统的各模块及其功能,系统所使用 的兼类词典、非兼类词典、词性标注集,最后对系统的总体性能进行测试并对测试结果进行了分析。
采用统计与规则相结合的混合策略,提出一种中国人名的自动识别方法.该方法利用知识库中的统计信息,对 中国人名作初步的提取,分析中国人名构成的内部特征和外部特征,提取出特征集,并总结出相应的识别规则,对候选人名进 行识别.在此基础上构建了一个中国人名识别系统,并对系统进行了测试,实验表明了算法的可行性和有效性