没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
共58个文件
sh:16个
txt:8个
xml:5个
Crawlzilla是一个「开源码的丛集式搜寻引擎建制和管理工具」,它支援了多种档案格式(html、pdf、word...)的搜寻,并提供搜寻引擎的管理(爬取设定管理、丛集节点管理、索引库管理)。主要目的是让使用者能更轻松地建置自己专属的搜寻引擎。若您想对Crawlzilla有更亲密一点的接触,欢迎用您的滑鼠大力点选以下连结(大哉问、特色和操作画面)。
资源推荐
资源详情
资源评论
收起资源包目录
Crawlzilla-1.1.2.tar.gz (58个子文件)
Crawlzilla_Install
conf
tomcat_conf
server.xml 5KB
crawlzilla_conf
crawlzilla-slave 2KB
crawlzilla-slave_chkconfig 2KB
crawlzilla-master 4KB
crawlzilla-master_chkconfig 4KB
nutch_conf
masters 0B
nutch-conf.xsl 511B
slaves 10B
mapred-site.xml 1KB
core-site.xml 331B
hadoop-env.sh 2KB
regex-urlfilter.txt 2KB
hdfs-site.xml 178B
nutch-site.xml 3KB
crawl-urlfilter.txt 2KB
docs
NOTICE.txt 325B
crawlzilla_Usage_zhtw.pdf 1.19MB
README.en.txt 677B
CHANGELOG.txt 2KB
AUTHORS 392B
README.zh.txt 689B
RELEASE-NOTE.txt 345B
install 34KB
main
prepare_go.sh 1KB
lib_crawl_go.sh 8KB
lang
lang_zh_TW 17KB
lang_en_US 17KB
lib_crawl_default.sh 60B
master_remove 7KB
duplicate_del.sh 2KB
slave_install 22KB
rm_DB.sh 952B
fix.sh 9KB
tomcat_restart.sh 2KB
lib_crawl_tmp.sh 56B
go.sh 2KB
slave_remove 7KB
slave_deploy.sh 1KB
log.sh 2KB
add_hosts.sh 2KB
auto_update.sh 2KB
crawlzilla 24KB
mergecrawl.sh 8KB
web
tomcat_default
patch.sh 281B
patch
zh
search.html 5KB
include
header.html 1KB
help.html 6KB
about.html 9KB
img
reiter
logo_nutch.gif 4KB
robots.gif 3KB
nchc_logo.jpg 40KB
WEB-INF
search_zh.properties 387B
classes
org
nutch
jsp
lib
IKAnalyzer3.2.8_nutch1.2.jar 1.12MB
nutch-1.2.jar 743KB
index.jsp 70B
crawlzilla.war 4.01MB
version 11B
LICENSE.txt 11KB
共 58 条
- 1
资源评论
- sunny_121382016-04-05挺不错的,就是我不会用
dgy610927
- 粉丝: 10
- 资源: 17
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功