# Ctrip_Crawler 携程景点爬虫
![image-20210313235926448](https://irimskyblog.oss-cn-beijing.aliyuncs.com/content/20210313235929.png)
![image-20210314000428177](https://irimskyblog.oss-cn-beijing.aliyuncs.com/content/20210314000432.png)
- 爬取的是 [**携程移动端**](https://m.ctrip.com/webapp/you/gspoi/sight/1.html?seo=1) 的数据(景点数据以及评论)
- 修改`config.ini`中的配置可以改变**目标城市**(默认北京)以及**爬取模式**
![](https://irimskyblog.oss-cn-beijing.aliyuncs.com/content/20210507163603.png)
- 爬取结果有两部分:`data/poi.csv`为**景点数据**,`data/comment/{id}.csv`为对应ID的景点的**评论数据**
- 评论内容的爬取有两种方法:
- 将`config.ini`中的`isCrawlComment`置为1,运行`poi_crawl.py`文件,在爬取 景点数据 的过程中爬取 评论数据
- 将`config.ini`中的`isCrawlComment`置为0,运行`poi_crawl.py`文件,在爬取 景点数据 结束后运行再运行`comment_crawl.py`文件,获取 景点数据 中的所有景点的评论
- 每次运行前都会在同一文件夹下复制一份上一次爬取的景点结果的备份,名为`back.csv`
- 数据中 **价格**、**最低价格**为response中的数据,暂无参考价值
- 后面四种人群门票价格为**预估的销量加权平均价格**,如果有不同需求可以修改 `GetTicketPrice` 函数。(返回的数据为所有的门票价格)
- 景点数据中的**开放时间**与**优惠政策** 数据的格式为json格式
- 爬取的 评论数据 格式为:
- **用户ID**
- **评论文本**
- **发送时间戳**
- **赞同数**
TODO:
后续可能会支持:
输入城市名称自动获取城市编号 (√)
如果上次爬取过程中断可以从断点处开始爬取 (√)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
基于python实现爬取携程景点数据与评论数据源码+项目说明.zip 已获导师指导并通过的97分的高分期末大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。 基于python实现爬取携程景点数据与评论数据源码+项目说明.zip 已获导师指导并通过的97分的高分期末大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。基于python实现爬取携程景点数据与评论数据源码+项目说明.zip 已获导师指导并通过的97分的高分期末大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。基于python实现爬取携程景点数据与评论数据源码+项目说明.zip 已获导师指导并通过的97分的高分期末大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。基于python实现爬取携程景点数据与评论数据源码+项目说明.zip 已获导师指导并通过的97分的高分期末大作业设计项目,可作为课程设计和期末大作业,下载即用无需修改,项目完整确保可以运行。基于python实现爬取携程景点数据与评论数据
资源推荐
资源详情
资源评论
收起资源包目录
基于python实现爬取携程景点数据与评论数据源码+项目说明.zip (6个子文件)
Ctrip_Crawler-主master
comment_crawl.py 2KB
config.ini 146B
poi_crawl.py 16KB
requirements.txt 39B
.gitignore 36B
README.md 2KB
共 6 条
- 1
猰貐的新时代
- 粉丝: 1w+
- 资源: 2558
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- (源码)基于物联网技术的办公自动化与安全管理系统.zip
- (源码)基于Spring Boot和Vue的若依管理系统.zip
- C#汽车4S综合管理系统源码 汽车美容4S店管理服务源码数据库 SQL2008源码类型 WebForm
- (源码)基于Arduino的STM32F1F4语音录制与播放系统.zip
- (源码)基于ASP.NET Boilerplate框架的微信支付管理系统.zip
- win屏幕墙,桌面画面动态更新,远程操作
- 基于纯JS实现的三维光学引擎
- “碰一碰”渠道营销源码
- (源码)基于Spring Boot框架的电商系统.zip
- 【重磅,更新!】全国290多个地级市资源错配指数、劳动和资本相对扭曲指数
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
前往页