# 深圳房地产二手楼盘数据分析<br>
使用Python抓取深圳链家房地产数据,保存至mysql数据库,并进行数据分析<br>
逻辑:<br>
1、通过任意一个链家网址进入,抓取链家二级域名网址,如sz.lianjia.com;bj.lianjia.com<br>
2、通过二级链接组装二手房链接地址,如sz.lianjia.com/ershoufang/<br>
3、获取二手房页面的筛选条件标签:地区、价格等,如ershoufang/p2/,再次进行组装,与当前请求的url<br>
--目标格式为sz.lianjia.com/ershoufang/p2/,可查询深圳市200-300万的房子<br>
4、查询当前筛选条件共多少页,获取页面的页码最大值,进行循环生成最终请求的url<br>
--如sz.lianjia.com/ershoufang/p2/pg2/<br>
5、进行请求最终url,并保存页面房产信息<br>
6、保存至mysql数据库<br>
# Configuration
前端框架:Bootstrap+Dash<br>
爬虫框架:Scrapy+BeautifulSoup<br>
数据库:Mysql<br>
数据分析模块:Pandas<br>
服务器:RedHat<br>
# Project log
Creation date:2017/12/22 10:41<br>
Version:0.1<br>
Describe:<br>
- Create Project
- Use Scrapy Requests
- Use Bs4 Responses Data
Version:0.2<br>
Update date:2017/12/25 20:37<br>
- Optimization data,(Id,Region,Garden,Layout,Size,Direction,Renovation,Elevator,Price)
- Save To Mysql Data
Version:0.3<br>
- Analysis data
Version:1.0<br>
- use Dash + pandas show data.
![分析首页](https://gitee.com/uploads/images/2018/0123/142030_be234a82_1338523.png "分析首页")
# Thanks
[Scrapy](http://scrapy-chs.readthedocs.io/zh_CN/latest/intro/overview.html)<br>
[BeautifulSoup](https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html#get-text)<br>
[Python菜鸟教程](http://www.runoob.com/python/python-dictionary.html)<br>
....
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
<项目介绍> 深圳房地产二手楼盘数据分析 使用Python抓取深圳链家房地产数据,保存至mysql数据库,并进行数据分析 逻辑: 1、通过任意一个链家网址进入,抓取链家二级域名网址,如sz.lianjia.com;bj.lianjia.com 2、通过二级链接组装二手房链接地址,如sz.lianjia.com/ershoufang/ 3、获取二手房页面的筛选条件标 - 不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 --------
资源推荐
资源详情
资源评论
收起资源包目录
ShenzhenRealestate-master.zip (33个子文件)
ShenzhenRealestate-master
HouseData
House-500.json 2.64MB
HouseData
__init__.py 0B
pipelines.py 283B
mysql
__init__.py 0B
pipelines_v3.py 619B
sql.py 1KB
pipelines_v1.py 828B
spiders
__init__.py 161B
lianjia_v2.py 4KB
lianjia.py 3KB
lianjia_v4.py 7KB
jsonload.py 1KB
lianjia_v3.py 5KB
items.py 2KB
settings.py 3KB
middlewares.py 2KB
scrapy.cfg 262B
Analysis
index.py 248B
example.txt 1.52MB
start.py 102B
House-all-id.json 2.32MB
House.json 12.11MB
House-node.json 8KB
start副本.py 102B
LICENSE 10KB
.idea
ShenzhenRealestate.iml 653B
dictionaries
super.xml 84B
vcs.xml 180B
workspace.xml 49KB
misc.xml 1KB
modules.xml 288B
Dash
.gitignore 1KB
README.md 2KB
共 33 条
- 1
资源评论
奋斗奋斗再奋斗的ajie
- 粉丝: 230
- 资源: 2166
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 2c60fbb3dt9ad50ed8864298eea1484b.MP4
- 基于yolov8+dlib实现视觉识别的安全驾驶监测系统部署到jetson NX平台源码+模型.zip
- Qt框架+OpenCV+动态爱心+编程教学+520
- 基于opencv+yolov8实现目标追踪及驻留时长统计源码.zip
- 水稻病害基于Yolov8算法优化目标检测识别与AI辅助决策python源码+模型+使用说明.zip
- 海尔618算价表_七海5.20_16.00xlsx(1)(2).xlsx
- WebCrawler.scr
- 【计算机专业毕业设计】大学生就业信息管理系统设计源码.zip
- YOLO 数据集:8种路面缺陷病害检测【包含划分好的数据集、类别class文件、数据可视化脚本】
- JAVA实现Modbus RTU或Modbus TCPIP案例.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功