# ReptileIntroduce
#### 介绍
小说网站爬虫
#### 需求
python 3.x
注意:lxml 目前不支持 3.11
#### 类库
lxml #pip install lxml
requests #pip install requests
#### 介绍2
```bash
python .\runPythonSprites.py -f .\findKeyDir -get -db -rp 2
python .\rebuildFindKeyWordFile.py .\fileKerIniDir
```
## 参数说明
```
runPythonSprites.py
爬虫脚本的总体调用脚本
-p 指定查找路径(文件夹)[新版是无效的]
-f 指定关键字文件[新版支持文件夹(它将会自动递归查找所有 txt 文件)]
-af 目标为目录,将会自动获取目录中的所有文件,并且填充到 -f 选项
-k 指定关键字,与 -f 可以联合使用
-s 指定关键字文件切割,默认为换行符
-get 将会自动调用爬虫脚本,添加参数为运行指定脚本。如:
-get hgq26 运行 hgq26.py,后缀 .py 可忽略,没有输入参数为运行已知脚本(参考 runPythonSprites.py 中 runStrpiteList 变量)
-ig 或 ignore 将会跳过该脚本的运行
-db 选择从数据库文件中导出信息[新版默认直接写入文件,但单个 py 的网站爬虫可以忽略]
-rp 筛选过期的小说
rebuildFindKeyWordFile.py
查找配置文件的总调整,会删除所有查找到的文件的关键字,删除重复并且排序有效内容
支持目录与文件参数,若输入目录,则会自动递归查找文件
-af 自动搜索路径(该路径包括文件与目录,目录时,将会递归枚举所有文件),并把所得赋予到 -f 选项下
```
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
reptile-introduce-master.zip (16个子文件)
reptile-introduce-master
requestNovelsLib.py 58KB
runFind.bat 146B
runcmdAtt.bat 50B
pywujixswNet.py 7KB
pybabayuTv.py 7KB
LICENSE 1KB
pykanshu5Net.py 5KB
pyhgq26Com.py 7KB
pyx81xzwCom.py 7KB
runRebuildFindKeyWordFile.bat 70B
py121duNet.py 7KB
.gitignore 1KB
runcmd.bat 64B
rebuildFindKeyWordFile.py 2KB
README.md 2KB
runPythonSprites.py 19KB
共 16 条
- 1
资源评论
「已注销」
- 粉丝: 17
- 资源: 15
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功