# Ctrip_Crawler 携程景点爬虫
![image-20210313235926448](https://irimskyblog.oss-cn-beijing.aliyuncs.com/content/20210313235929.png)
![image-20210314000428177](https://irimskyblog.oss-cn-beijing.aliyuncs.com/content/20210314000432.png)
- 爬取的是 [**携程移动端**](https://m.ctrip.com/webapp/you/gspoi/sight/1.html?seo=1) 的数据(景点数据以及评论)
- 修改`config.ini`中的配置可以改变**目标城市**(默认北京)以及**爬取模式**
![](https://irimskyblog.oss-cn-beijing.aliyuncs.com/content/20210507163603.png)
- 爬取结果有两部分:`data/poi.csv`为**景点数据**,`data/comment/{id}.csv`为对应ID的景点的**评论数据**
- 评论内容的爬取有两种方法:
- 将`config.ini`中的`isCrawlComment`置为1,运行`poi_crawl.py`文件,在爬取 景点数据 的过程中爬取 评论数据
- 将`config.ini`中的`isCrawlComment`置为0,运行`poi_crawl.py`文件,在爬取 景点数据 结束后运行再运行`comment_crawl.py`文件,获取 景点数据 中的所有景点的评论
- 每次运行前都会在同一文件夹下复制一份上一次爬取的景点结果的备份,名为`back.csv`
- 数据中 **价格**、**最低价格**为response中的数据,暂无参考价值
- 后面四种人群门票价格为**预估的销量加权平均价格**,如果有不同需求可以修改 `GetTicketPrice` 函数。(返回的数据为所有的门票价格)
- 景点数据中的**开放时间**与**优惠政策** 数据的格式为json格式
- 爬取的 评论数据 格式为:
- **用户ID**
- **评论文本**
- **发送时间戳**
- **赞同数**
TODO:
后续可能会支持:
输入城市名称自动获取城市编号 (√)
如果上次爬取过程中断可以从断点处开始爬取 (√)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
基于python实现爬取携程景点数据与评论数据源码+项目说明.zip 已获导师指导并通过的97分的高分期末大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。 基于python实现爬取携程景点数据与评论数据源码+项目说明.zip 已获导师指导并通过的97分的高分期末大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。基于python实现爬取携程景点数据与评论数据源码+项目说明.zip 已获导师指导并通过的97分的高分期末大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。基于python实现爬取携程景点数据与评论数据源码+项目说明.zip 已获导师指导并通过的97分的高分期末大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。基于python实现爬取携程景点数据与评论数据源码+项目说明.zip 已获导师指导并通过的97分的高分期末大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。基于python实现爬取携程景点数据与评论数据
资源推荐
资源详情
资源评论
收起资源包目录
基于python实现爬取携程景点数据与评论数据源码+项目说明.zip (6个子文件)
Ctrip_Crawler-主master
comment_crawl.py 2KB
config.ini 146B
poi_crawl.py 16KB
requirements.txt 39B
.gitignore 36B
README.md 2KB
共 6 条
- 1
猰貐的新时代
- 粉丝: 1w+
- 资源: 2571
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- apache-maven-3.6.1-bin.zip
- c593f5fc-d4a7-4b43-8ab2-51afc90f3f62
- IIR滤波器参数计算函数
- WPF树菜单拖拽功能,下级目录拖到上级目录,上级目录拖到下级目录.zip
- CDH6.3.2版本hive2.1.1修复HIVE-14706后的jar包
- 鸿蒙项目实战-天气项目(当前城市天气、温度、湿度,24h天气,未来七天天气预报,生活指数,城市选择等)
- Linux环境下oracle数据库服务器配置中文最新版本
- Linux操作系统中Oracle11g数据库安装步骤详细图解中文最新版本
- SMA中心接触件插合力量(插入力及分离力)仿真
- 变色龙记事本,有NPP功能,JSONview功能
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
前往页