没有合适的资源?快使用搜索试试~ 我知道了~
JobHunter:使用Selenium抓取职业网站的网站
共4个文件
md:1个
gitignore:1个
ipynb:1个
需积分: 10 0 下载量 52 浏览量
2021-02-16
21:51:52
上传
评论
收藏 23KB ZIP 举报
温馨提示
求职者 这里的挑战是从几个石油公司的职业网站上刮取工作清单结果,然后将结果合并到一个可搜索的DataFrame中。 从动态网页中收集数据似乎并非易事,并且代码难以维护。 但这是一个很好的学习经验。 Web抓取的新手,我很快就意识到这些网站很难抓取,因为将搜索结果分页(分布在多个页面上),例如一次25个结果。 该脚本必须导航到并遍历每组结果,并将每个结果追加到DataFrame。 另外,由于内容是动态的并且易于更改,因此脚本不可靠,很容易损坏。 当然,每个站点都是唯一的,每个职位列表的格式可能不一致。 该脚本使用Selenium模块对两个站点Hallibuton和BP职业站点执行网络抓取,因为我发现这些站点更容易抓取。 它仅检索作业的标题信息(角色,位置等),而不检索每个列表后面的详细内容。
资源推荐
资源详情
资源评论
收起资源包目录
JobHunter-master.zip (4个子文件)
JobHunter-master
results.csv 25B
README.md 1KB
.gitignore 2KB
Web scraping career sites with Selenium.ipynb 165KB
共 4 条
- 1
资源评论
不爱说话的我
- 粉丝: 17
- 资源: 4616
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功