没有合适的资源?快使用搜索试试~ 我知道了~
xmljava系统源码-lspider:轻网蜘蛛系统
共102个文件
cpp:43个
h:34个
m4:7个
需积分: 9 0 下载量 165 浏览量
2021-06-06
00:02:23
上传
评论
收藏 210KB ZIP 举报
温馨提示
xml java系统源码 lspider Linux下的轻量级网页抓取系统 功能特性 将整套spider系统功能浓缩到一个二进制中,部署轻便 多线程和并发网络通信,性能高,资源利用充分,单机可同时抓取数百站点并能保持cpu低占用 简易配置,指定待抓取站点列表和高质量种子链接即可自适应抓取扩散至整站,参考链接深度的广度优先遍历同时保证时新性 通过配置不同站点ip的抓取压力,全异步的压力控制和链接调度,优雅抓取,避免封禁 基于WebKit的可定制的页面渲染和链接提取,便于性能和效果之间的权衡 mysql作为链接存储介质,更高效;mongo作为网页存储介质,便于字段扩展和快速查询 天然支持分布式部署(基于站点划分),可横向扩展 安装依赖 libevent (>=2.0.22) thrift (>=0.9.2) qt (>=4.8.6) mongo-cxx-driver-legacy (>=1.0.2) log4cplus (>=1.2.0) boost (>=1.58.0) 安装方法(RHEL6) ===============================================
资源推荐
资源详情
资源评论
收起资源包目录
xmljava系统源码-lspider:轻网蜘蛛系统 (102个子文件)
configure.ac 1KB
Makefile.am 2KB
configure 204KB
url_tools.cpp 42KB
http_processor.cpp 16KB
CrawlService.cpp 15KB
http_protocol.cpp 10KB
util.cpp 9KB
mysql_dumper.cpp 7KB
mysql_selector.cpp 7KB
extractor_worker_view.cpp 5KB
link_table.cpp 5KB
lthread.cpp 4KB
mongo_dumper.cpp 4KB
conf.cpp 4KB
lspider_client.cpp 4KB
url_context.cpp 4KB
moc_extractor_worker_view.cpp 3KB
link_scheduler.cpp 3KB
moc_mysql_selector.cpp 3KB
main.cpp 3KB
moc_mysql_dumper.cpp 3KB
moc_link_scheduler.cpp 3KB
lspider_types.cpp 3KB
cmd_ctrler.cpp 2KB
test_util.cpp 2KB
request_recv.cpp 2KB
mysql_base.cpp 2KB
http_event_engine.cpp 2KB
test_mysql.cpp 2KB
test_backtrace.cpp 2KB
test_mongo.cpp 2KB
crawl_listen_handler.cpp 1KB
test_urlnormalize.cpp 1KB
test_qweb.cpp 1KB
test_keyedqueue.cpp 1KB
extractor.cpp 1KB
test_priorityqueue.cpp 1KB
parse_url.cpp 963B
test_bson.cpp 948B
test_fetchmaindomain.cpp 843B
test_qtextcodec.cpp 538B
test_log.cpp 510B
logger_container.cpp 378B
controllable.cpp 372B
lspider_constants.cpp 294B
log.properties.demo 2KB
conf.xml.demo 1KB
maindomain.list.demo 15B
depcomp 23KB
config.guess 44KB
CrawlService.h 9KB
DoubleList.h 6KB
lthread.h 5KB
link.h 4KB
url_context.h 4KB
keyed_queue.h 4KB
link_table.h 3KB
http_processor.h 3KB
atomic.h 2KB
util.h 2KB
mysql_dumper.h 2KB
lspider_types.h 2KB
crawl_listen_handler.h 2KB
extractor_worker_view.h 2KB
conf.h 1KB
locked_queue.h 1KB
mongo_dumper.h 1KB
link_scheduler.h 1KB
logger_container.h 1KB
mysql_base.h 1KB
synced_queue.h 1KB
url_tools.h 1KB
http_event_engine.h 1KB
mysql_selector.h 1KB
http_protocol.h 1011B
singleton.h 915B
extractor.h 907B
locked_map.h 874B
request_recv.h 837B
cmd_ctrler.h 801B
controllable.h 562B
mutex_lock.h 451B
lspider_constants.h 380B
defines.h 193B
Makefile.in 109KB
install-sh 14KB
aclocal.m4 36KB
ax_boost.m4 11KB
ax_mongo_client.m4 2KB
ax_log4cplus.m4 2KB
ax_libevent.m4 2KB
ax_thrift.m4 2KB
ax_qt5.m4 2KB
Makefile 739B
README.md 4KB
missing 7KB
create.sql 718B
stamp-h1 23B
config.sub 35KB
共 102 条
- 1
- 2
资源评论
weixin_38592455
- 粉丝: 7
- 资源: 896
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 毕设和企业适用springboot企业资源规划类及在线学习平台源码+论文+视频.zip
- 毕设和企业适用springboot企业资源规划类及智慧安防系统源码+论文+视频.zip
- 毕设和企业适用springboot区块链技术类及企业云管理平台源码+论文+视频.zip
- 毕设和企业适用springboot企业资源规划类及智能医疗监测系统源码+论文+视频.zip
- 毕设和企业适用springboot企业资源规划类及智能城市数据管理平台源码+论文+视频.zip
- 毕设和企业适用springboot企业资源规划类及智慧社区管理平台源码+论文+视频.zip
- 毕设和企业适用springboot区块链技术类及数字营销平台源码+论文+视频.zip
- 毕设和企业适用springboot汽车电商类及城市智能管理系统源码+论文+视频.zip
- 毕设和企业适用springboot汽车电商类及城市智能运营平台源码+论文+视频.zip
- 毕设和企业适用springboot汽车电商类及广告效果评估平台源码+论文+视频.zip
- 毕设和企业适用springboot区块链技术类及网络营销平台源码+论文+视频.zip
- 毕设和企业适用springboot汽车电商类及跨境电商管理平台源码+论文+视频.zip
- 毕设和企业适用springboot汽车电商类及教学资源共享平台源码+论文+视频.zip
- 毕设和企业适用springboot区块链技术类及云端储物管理系统源码+论文+视频.zip
- 毕设和企业适用springboot区块链技术类及在线教育管理系统源码+论文+视频.zip
- 毕设和企业适用springboot区块链技术类及智能会议管理平台源码+论文+视频.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功