没有合适的资源?快使用搜索试试~ 我知道了~
Spark大数据中文分词统计Java工程源码
共48个文件
class:19个
txt:12个
java:5个
4星 · 超过85%的资源 需积分: 50 261 下载量 185 浏览量
2016-08-12
22:54:12
上传
评论 4
收藏 379KB 7Z 举报
温馨提示
参考网络资源使用IKAnalyzer分词组件,实现了纯Java语言、MapReduce模式及Spark 框架三种方式对唐诗宋词等国学经典进行中文分词统计排序的功能,你可以轻松发现唐诗宋词中最常用的词是那几个。
资源推荐
资源详情
资源评论
收起资源包目录
JavaWordCount 20160813.7z (48个子文件)
JavaWordCount
src
com
magicstudio
spark
SortableMap.java 3KB
text
老子道德经.txt 22KB
论语.txt 74KB
宋词三百首.txt 111KB
孟子.txt 131KB
唐诗三百首.txt 85KB
庄子南华经.txt 240KB
WordCounter.java 16KB
stopword.dic 161B
SparkWordCount.java 10KB
HadoopWordCount.java 9KB
FileUtil.java 4KB
IKAnalyzer.cfg.xml 414B
screen shoot.png 131KB
bin
com
magicstudio
spark
text
老子道德经.txt 22KB
论语.txt 74KB
宋词三百首.txt 111KB
孟子.txt 131KB
唐诗三百首.txt 85KB
庄子南华经.txt 240KB
SparkWordCount$1.class 1KB
SparkWordCount.class 6KB
SortableMap.class 4KB
SparkWordCount$2.class 1KB
SortableMap$MapValueComparator.class 1KB
stopword.dic 161B
HadoopWordCount$TokenizerMapper.class 3KB
WordCounter$1.class 1KB
HadoopWordCount$IntWritableDecreasingComparator.class 1010B
SparkWordCount$3.class 1KB
SortableMap$MapKeyComparator.class 1KB
WordCounter.class 15KB
SparkWordCount$5.class 2KB
HadoopWordCount$IntSumReducer.class 3KB
WordCounter$3.class 949B
SparkWordCount$6.class 2KB
IKAnalyzer.cfg.xml 414B
WordCounter$2.class 1KB
HadoopWordCount.class 5KB
FileUtil.class 2KB
SparkWordCount$4.class 2KB
screen shoot.png 131KB
.classpath 641B
.settings
org.eclipse.core.runtime.prefs 52B
org.eclipse.core.resources.prefs 174B
org.eclipse.jdt.ui.prefs 5KB
org.eclipse.jdt.core.prefs 670B
.project 389B
共 48 条
- 1
dumbbellyang
- 粉丝: 62
- 资源: 106
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
- 3
前往页