没有合适的资源?快使用搜索试试~ 我知道了~
爬虫+分词+Word2vec向量化的实现.zip
共175个文件
java:56个
class:51个
jar:21个
5星 · 超过95%的资源 需积分: 12 105 下载量 30 浏览量
2016-03-28
22:46:10
上传
评论 4
收藏 8.74MB ZIP 举报
温馨提示
可以实现网页的爬取,到分词,词语的向量化
资源推荐
资源详情
资源评论
收起资源包目录
爬虫+分词+Word2vec向量化的实现.zip (175个子文件)
beanybaby 2KB
vectors_good.bin 27KB
IKQueryExpressionParser.class 11KB
Learn.class 11KB
Learn.class 11KB
Word2VEC.class 9KB
Word2VEC.class 9KB
Dictionary.class 8KB
IKAnalyzerDemo.class 6KB
AnalyzeContext.class 6KB
DictSegment.class 5KB
CN_QuantifierSegmenter.class 5KB
SWMCQueryBuilder.class 4KB
LexemePath.class 4KB
Lexeme.class 4KB
WordKmeans.class 4KB
FunctionUtils.class 4KB
LetterSegmenter.class 4KB
IKArbitrator.class 4KB
IKSegmenter.class 4KB
WordKmeans$Classes.class 3KB
DefaultConfig.class 3KB
MapCount.class 3KB
Test整合.class 3KB
QuickSortSet.class 3KB
CJKSegmenter.class 3KB
Test2.class 2KB
Test.class 2KB
QuickSortSet$Cell.class 2KB
DownloadPage.class 2KB
Test$2.class 2KB
IKTokenizer.class 2KB
WordNeuron.class 2KB
Hit.class 2KB
Haffman.class 2KB
WordKmeans$Classes$1.class 2KB
HrefOfPage.class 2KB
CharacterUtil.class 2KB
IKAnalyzer.class 1KB
WordEntry.class 1KB
READ.class 1KB
UrlQueue.class 1KB
Test$1.class 1KB
Test.class 1014B
IKQueryExpressionParser$Element.class 1003B
Test$4.class 989B
Test$3.class 973B
UrlDataHanding.class 937B
VisitedUrlQueue.class 868B
Neuron.class 806B
HiddenNeuron.class 455B
Configuration.class 424B
ISegmenter.class 215B
.classpath 2KB
filterbuilder.cmd 2KB
thumbelina.cmd 2KB
sitecapturer.cmd 2KB
beanybaby.cmd 2KB
translate.cmd 2KB
parser.cmd 2KB
lexer.cmd 2KB
main2012.dic 2.91MB
main2012.dic 2.91MB
chinese_stopword.dic 9KB
chinese_stopword.dic 9KB
quantifier.dic 2KB
quantifier.dic 2KB
stopword.dic 191B
stopword.dic 191B
ext.dic 10B
ext.dic 10B
fenci.doc 11KB
cixiangliang.doc 46KB
javaVector.doc 38KB
网络爬虫.docx 15KB
从网页爬取到分词(说明文档).docx 12KB
filterbuilder 1KB
.gitignore 59B
.gitignore 59B
readme.html 8KB
lucene-core-3.6.0.jar 1.46MB
IKAnalyzer2012_FF.jar 1.11MB
httpclient-4.3.1.jar 572KB
httpclient-4.0.1.jar 284KB
httpcore-4.3.jar 276KB
commons-httpclient-3.0.jar 273KB
commons-codec-1.6.jar 227KB
httpcore-4.2.1.jar 218KB
lucene-analyzers-3.0.1.jar 196KB
httpclient-cache-4.3.1.jar 145KB
htmlparser.jar 136KB
htmlparser.jar 136KB
htmllexer.jar 70KB
filterbuilder.jar 68KB
commons-logging-1.1.3.jar 61KB
lucene-highlighter-3.0.1.jar 46KB
thumbelina.jar 42KB
httpmime-4.3.1.jar 36KB
lucene-memory-3.0.1.jar 27KB
fluent-hc-4.3.1.jar 22KB
共 175 条
- 1
- 2
资源评论
- qiangguoyu14502017-11-01不错,很好的资源
洛克-李
- 粉丝: 184
- 资源: 8
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功