
python 爬取招聘网信息并保存为 csv 文件
我们以猎聘网为例
一、打开网站查找信息
进入后搜索想要爬取的岗位信息,右键选择 “检查” 进入开发者界面
点击右上角的 network,选择 doc
然后点击图中的搜索按钮,输入想要爬取的岗位名称,然后刷新页面,选择搜索下边的第二
个
这个时候我们看到有我们需要的 url,从中也可知网站的请求方式为 get 请求,我们也得用 get
请求!
部分代码解析:
1、导入模块
import parsel
import requests
import csv
1
2
3
2、用 url 放我们的网址
url = 'https://www.liepin.com/zhaopin/'
1
3、定义 data 放我们的参数
这个是网页中 payload 的参数,也就是 url 中问号后面的参数
data = {
'inputFrom': 'www_index',
'workYearCode': '0',
'key': 'python',
'scene': 'input',
'ckId': 'kfpt1emhvkrshc9o4h2xquxd74pfihmb',
}
1
2
3
4
5