没有合适的资源?快使用搜索试试~ 我知道了~
od-database:用于公共目录索引的分布式搜寻器,数据库和Web前端
共86个文件
py:19个
css:15个
html:11个
需积分: 9 0 下载量 163 浏览量
2021-01-31
17:20:42
上传
评论
收藏 1.57MB ZIP 举报
温馨提示
OD数据库 OD数据库是一个Web爬网项目,旨在从打开的目录(配置错误的Apache / Nginx / FTP服务器,或更常见的是各种公共服务的镜像)中索引大量文件链接及其基本元数据。 每个搜寻器实例均从中央服务器获取任务,并在完成后推送结果。 一个实例可以同时抓取数百个网站(FTP和HTTP(S)),并且中央服务器每秒可以提取成千上万个新文档。 数据被索引到elasticsearch中,并通过Web前端(当前托管在 )提供。 当前,大约有19.3亿个文件被索引(原始数据总计约300Gb)。 原始数据以CSV文件形式提供。 贡献 欢迎提出建议/疑虑/公关 安装(Docker) git clone --recursive https://github.com/simon987/od-database cd od-database mkdir oddb_pg_data/ tt_pg_data/ es_data/ wsb_data/ docker-compose up 建筑 运行爬网服务器 作为该项目一部分的python搜寻器已停产, 当前正在使用中。
资源推荐
资源详情
资源评论
收起资源包目录
od-database-master.zip (86个子文件)
od-database-master
high_level_diagram.png 332KB
.gitignore 152B
Dockerfile 157B
captchas
.gitkeep 0B
high_level_diagram.dia 4KB
task_tracker_drone
templates
submit.html 3KB
layout.html 2KB
dashboard.html 3KB
contribute.html 565B
admin.html 912B
stats.html 3KB
search.html 14KB
downloads.html 1KB
home.html 2KB
website.html 3KB
websites.html 2KB
requirements.txt 219B
fold_to_ascii
tasks.py 7KB
__init__.py 2B
views.py 15KB
search
__init__.py 346B
filter.py 821B
search.py 16KB
database.py 11KB
init_script.sql 790B
LICENSE 1KB
uwsgi.ini 110B
captcha.py 7KB
static
webfonts
fa-brands-400.ttf 96KB
fa-solid-900.eot 104KB
fa-solid-900.svg 382KB
fa-regular-400.eot 30KB
fa-brands-400.eot 96KB
fa-brands-400.woff 62KB
fa-brands-400.svg 496KB
fa-solid-900.ttf 103KB
fa-solid-900.woff2 39KB
fa-regular-400.woff2 12KB
fa-brands-400.woff2 53KB
fa-solid-900.woff 49KB
fa-regular-400.ttf 30KB
fa-regular-400.woff 14KB
fa-regular-400.svg 105KB
downloads
README.md 51B
Hack-Regular.ttf 302KB
js
script.js 344KB
popper.min.js 20KB
jquery.min.js 85KB
report.js 15KB
Chart.min.js 154KB
bootstrap.min.js 48KB
ion.rangeSlider.min.js 40KB
css
main.css 4KB
fa-brands.css 686B
ion.rangeSlider.skinFlat.css 2KB
fontawesome-all.css 43KB
fa-brands.min.css 632B
fa-solid.min.css 642B
fontawesome.min.css 33KB
fa-regular.css 705B
fontawesome.css 41KB
ion.rangeSlider.css 3KB
bootstrap.min.css 141KB
fa-regular.min.css 650B
fa-solid.css 698B
style.css 176KB
fontawesome-all.min.css 35KB
img
bg.png 11KB
forkme_right_white_ffffff.png 7KB
sprite-skin-flat.png 3KB
ws_bucket_client
docker-compose.yml 3KB
.gitmodules 324B
api.py 4KB
README.md 1KB
config.py 1KB
template_filters.py 1KB
,gitattributes 104B
mass_import.py 2KB
tt_config.yml 433B
od_util.py 9KB
common.py 1KB
app.py 621B
main.py 83B
export.py 2KB
do_recrawl.py 66B
reddit_bot.py 3KB
共 86 条
- 1
资源评论
婉君喜欢DIY
- 粉丝: 13
- 资源: 4617
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功