# HLSpider
基于[Scrapy](https://github.com/scrapy/scrapy)的页面敏感词检测工具.
## 特性
1. 支持可控范围的页面扫描。
2. 更全面的链接提取机制,即使链接不具有`href`,不具有`http`/`https`协议头也同样可以提取到。
3. 高速的多线程扫描机制。
## 安装
```shell
# clone repo
git clone https://github.com/whwlsfb/HLSpider
cd HLSpider
# isntall requirements
pip install -r requirements.txt
```
## 使用
```shell
$ python spider.py
@@@ @@@ @@@ @@@@@@ @@@@@@@ @@@ @@@@@@@ @@@@@@@@ @@@@@@@
@@@ @@@ @@@ @@@@@@@ @@@@@@@@ @@@ @@@@@@@@ @@@@@@@@ @@@@@@@@
@@! @@@ @@! !@@ @@! @@@ @@! @@! @@@ @@! @@! @@@
!@! @!@ !@! !@! !@! @!@ !@! !@! @!@ !@! !@! @!@
@!@!@!@! @!! !!@@!! @!@@!@! !!@ @!@ !@! @!!!:! @!@!!@!
!!!@!!!! !!! !!@!!! !!@!!! !!! !@! !!! !!!!!: !!@!@!
!!: !!! !!: !:! !!: !!: !!: !!! !!: !!: :!!
:!: !:! :!: !:! :!: :!: :!: !:! :!: :!: !:!
:: ::: :: :::: :::: :: :: :: :::: :: :: :::: :: :::
: : : : :: : : :: : : : : :: : : : :: :: : : :
HLSpider (Hide link spider).
usage: spider.py [-h] -u URLS -d DOMAINS [-o OUTPUT]
页面敏感字爬虫。
optional arguments:
-h, --help show this help message and exit
-u URLS, --urls URLS 扫描起始地址,多个地址使用英文逗号(,)分隔。例如:'http://www.baidu.com'
-d DOMAINS, --domains DOMAINS
需要进行深度扫描的根域名,多个域名使用英文逗号(,)分隔。例如:'baidu.com'
-o OUTPUT, --output OUTPUT
导出问题链接的CSV文件的保存位置,不填写则仅显示不保存。
```
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
Python基于Scrapy的页面敏感词检测工具源码.zip (10个子文件)
HLSpider-master
spider.py 5KB
dupefilter
repeatUrl.py 1KB
__init__.py 32B
words.db 88KB
LICENSE 11KB
requirements.txt 14B
.gitignore 49B
README.md 2KB
extractor
__init__.py 42B
rlinkextractor.py 3KB
共 10 条
- 1
资源评论
- xzjlovelxl2023-03-29感谢大佬分享的资源给了我灵感,果断支持!感谢分享~
- regoo0292022-07-12感谢资源主的分享,这个资源对我来说很有用,内容描述详尽,值得借鉴。
- m0_517602242022-10-13发现一个宝藏资源,资源有很高的参考价值,赶紧学起来~
- kjg77585212022-08-12资源简直太好了,完美解决了当下遇到的难题,这样的资源很难不支持~
- kefu125hao22023-01-10内容与描述一致,超赞的资源,值得借鉴的内容很多,支持!
「已注销」
- 粉丝: 795
- 资源: 3612
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 自动驾驶定位系列教程十:闭环修正.pdf
- HM2333-VB一款P-Channel沟道SOT23的MOSFET晶体管参数介绍与应用说明
- Python实现插入排序算法(源代码)
- 123.cpp
- HM2319-VB一款P-Channel沟道SOT23的MOSFET晶体管参数介绍与应用说明
- modbus4j-3.0.4.jar
- 蒙特·卡罗实验、使用蒙特·卡罗方法计算圆周率近似值.docx
- HM2319A-VB一款P-Channel沟道SOT23的MOSFET晶体管参数介绍与应用说明
- JAVA SpringBoot 集成华为云OBS,多镜像配置settings
- 一个文件共享系统,包括前端文件展示系统和后台管理系统,基于SpringBoot + MyBatis实现
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功