没有合适的资源?快使用搜索试试~ 我知道了~
PTT-Crawler:专用于PTT网站的网络爬虫
共5个文件
py:2个
gitignore:1个
md:1个
需积分: 9 0 下载量 34 浏览量
2021-04-30
19:32:04
上传
评论 1
收藏 6KB ZIP 举报
温馨提示
PTT Crawler 一个练习网路爬虫的小实验,可以取出PTT 文章中标题、内容与推文。 使用方式 批量爬取 crawler = PttCrawler () crawler . crawl ( board = "欲爬取的看版名稱" , start = StartIndex , end = EndIndex ) start表示想从哪一页开始爬取, end则是爬到哪一页时会停止,比方说想爬取八卦版的90 ~ 100页,可以设定为: crawler . crawl ( board = "Gossiping" , start = 90 , end = 101 ) 单一页面爬取 透过调用crawler.parse_article(url)可以爬取单一页面,回传值为包含文章资讯的dictionary crawler = PttCrawler () result = crawler . pars
资源推荐
资源详情
资源评论
收起资源包目录
PTT-Crawler-master.zip (5个子文件)
PTT-Crawler-master
Crawler.py 7KB
LICENSE 1KB
README.md 2KB
.gitignore 1KB
example.py 678B
共 5 条
- 1
资源评论
沪漂购房记
- 粉丝: 19
- 资源: 4614
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 蓝桥杯2024年第十五届省赛真题-前缀总分
- com.qihoo.appstore_300101305-1.apk
- tensorflow-gpu-2.7.1-cp37-cp37m-manylinux2010-x86-64.whl
- tensorflow-2.7.2-cp37-cp37m-manylinux2010-x86-64.whl
- tensorflow-2.7.1-cp39-cp39-manylinux2010-x86-64.whl
- 蓝桥杯2024年第十五届省赛真题-传送阵
- com.qihoo.appstore_300101305.apk
- linux之线程同步一.doc
- keil5配色方案10种
- python烟花代码.doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功