没有合适的资源?快使用搜索试试~ 我知道了~
Seeker---A-Search-Engine:使用 Nutch 和 Hadoop 实现搜索引擎
共162个文件
jar:99个
class:18个
java:15个
需积分: 5 0 下载量 5 浏览量
2021-07-05
06:05:06
上传
评论
收藏 32.64MB ZIP 举报
温馨提示
搜索者---A-Search-Engine Seeker 是一个搜索引擎的实现。 使用 Apache Nutch 抓取 40 个(体育和教育)域的网页。 倒排索引是使用 Apache Hadoop 从爬取的数据中构建的。 爬取的数据和倒排索引保存在nosql MongoDB数据库中,响应速度更快,扩展性更强。 Web 应用程序使用部署在 Apache Tomcat 服务器中的 REST Web 服务与数据库进行通信。 网页通过算法 TF-IDF 和链接分析进行排名。
资源推荐
资源详情
资源评论
收起资源包目录
Seeker---A-Search-Engine:使用 Nutch 和 Hadoop 实现搜索引擎 (162个子文件)
TfIdf.class 8KB
LoadDatabase.class 6KB
SearchService.class 6KB
DBUtil.class 5KB
CountWords.class 4KB
LinkAnalysis.class 3KB
DynamicPageCount.class 2KB
MorphiaUtil.class 1KB
LinkAnalysis$1.class 1KB
TfIdf$1.class 1KB
WSResponse.class 1KB
Index.class 1KB
InLinks.class 1KB
Document.class 1KB
DocWords.class 987B
SearchService$2.class 905B
SearchService$1.class 905B
SearchResult.class 854B
.classpath 761B
.classpath 625B
.classpath 576B
org.eclipse.wst.common.component 471B
org.eclipse.wst.common.component 462B
org.eclipse.wst.jsdt.ui.superType.container 49B
org.eclipse.wst.jsdt.ui.superType.container 49B
style.css 348B
opencv_java249.dll 8.99MB
.gitignore 15B
query.html 2KB
facedetect-openimaj.jar 5.4MB
xalan.jar 3MB
guava-14.0.1.jar 2.09MB
jai_core.jar 1.81MB
lucene-core-3.6.2.jar 1.47MB
lucene-analyzers-3.6.2.jar 1.12MB
gdata-core-1.0.jar 1015KB
mysql-connector-java-5.1.14-bin.jar 758KB
jackson-mapper-asl-1.9.2.jar 748KB
flex-messaging-core.jar 629KB
jersey-server-1.18.jar 599KB
httpclient-4.3.1.jar 572KB
colt.jar 568KB
commons-collections-3.2.1.jar 562KB
jersey-core-1.18.jar 468KB
sqljdbc4.jar 455KB
opencv-249.jar 437KB
log4j-1.2.15.jar 383KB
mail.jar 363KB
JJILCore.jar 349KB
commons-math-1.2.jar 331KB
sjsxp.jar 329KB
backport-util-concurrent.jar 319KB
asm-all-repackaged-2.2.0-b21.jar 313KB
mongo-2.7.3.jar 285KB
twitter4j-core-3.0.4.jar 282KB
cglib-2.2.0-b21.jar 276KB
httpcore-4.3.jar 276KB
commons-httpclient-3.0.1.jar 273KB
commons-lang-2.5.jar 273KB
jai_codec.jar 252KB
gson-2.2.4-javadoc.jar 244KB
morphia-0.98.jar 243KB
org.osgi.core-4.2.0.jar 241KB
commons-codec-1.6.jar 227KB
commons-beanutils-1.8.3.jar 227KB
jackson-core-asl-1.9.2.jar 223KB
imgscalr-lib-4.2.jar 222KB
commons-cli-1.2-javadoc.jar 209KB
servlet-api.jar 193KB
twitter4j-async-3.0.4.jar 189KB
gson-2.2.4.jar 186KB
commons-io-2.4.jar 181KB
concurrent.jar 168KB
jersey-json-1.18.jar 161KB
jviolajones2.0.jar 161KB
json-lib-2.4-jdk15.jar 155KB
jdom-1.1.3.jar 148KB
httpclient-cache-4.3.1.jar 145KB
hk2-locator-2.2.0-b21.jar 144KB
gdata-photos-2.0.jar 136KB
jersey-client-1.18.jar 131KB
hk2-api-2.2.0-b21.jar 127KB
stax-utils.jar 125KB
twitter4j-examples-3.0.4.jar 125KB
gson-2.2.4-sources.jar 125KB
jersey-servlet-1.18.jar 124KB
gdata-client-1.0.jar 124KB
activation.jar 121KB
jaxb-api-2.2.7.jar 98KB
json.jar 91KB
flex-messaging-common.jar 88KB
ezmorph-1.0.6.jar 84KB
javax.servlet-api-3.0.1.jar 83KB
JJIL-J2SE.jar 69KB
gdata-media-1.0.jar 67KB
jettison-1.1.jar 66KB
hk2-utils-2.2.0-b21.jar 65KB
flex-messaging-proxy.jar 65KB
validation-api-1.1.0.Final.jar 62KB
commons-logging-1.1.3.jar 61KB
共 162 条
- 1
- 2
资源评论
温暖如故
- 粉丝: 24
- 资源: 4642
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功