# Python_second-hand_house_Visualization_Analysis
基于Python的南京二手房数据采集及可视化分析设计
## 开发环境:Pycharm工具,Python3.7环境
### 1 内容简介
首先通过爬虫采集链家网上所有南京二手房的房源数据,并对采集到的数据进行清洗;然后,对清洗后的数据进行可视化分析,探索隐藏在大量数据背后的规律;最后,采用一个聚类算法对所有二手房数据进行聚类分析,并根据聚类分析的结果,将这些房源大致分类,以对所有数据的概括总结。通过上述分析,我们可以了解到目前市面上二手房各项基本特征及房源分布情况,帮助我们进行购房决策。
### 2 应用技术介绍
(1)Python网络爬虫技术
Requests
Beautifulsoup
(2)Python数据分析技术
Numpy
Matplotlib
Pandas
(3)k-means聚类算法
(4)高德地图开发者应用JS API
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
项目名称:基于Python的二手数据采集及可视化分析 项目介绍: 这个旨在利用Python编程语言,通过网络爬虫技术采集二手房房产数据,并通过数据可视化工具对数据进行分析和可视化。通过该项目,您可以获取各个城市的二手房房价、面积、地理位置等信息,并通过图表和可视化界面现数据分布、趋势和相关关系。 项目流程: 1. 数据采集:使用Python的网络爬虫库如Requests、BeautifulSoup等,爬取二手房房产网站上的数据。您可以选择合适的数据源,例如链家网、房天下等。 2. 数据清洗与预处理:通过Python的数据处理库(如Pandas)清洗与预采集到的原始数据。这一步骤包括去除重复值、处理缺失值、转换数据类型等,以确保质量。 3. 数据存储:将处理后的数据存储到数据库中,例如SQLite、MySQL或MongoDB,以便后续分析使用。 4. 数据分析与可视化:使用Python的数据可视化库(如Matplotlib、Seaborn、Plotly等),对清洗后的数据进行分析和可视化展示。根据需求,选择合适的图表类型,如柱状图、折线图、散点图等,展示房价趋势、面积分布、地理
资源推荐
资源详情
资源评论
收起资源包目录
Python毕业设计-基于Python的二手房数据采集及可视化分析项目源码+全部资料PPT文件.zip (115个子文件)
ershoufang-origin-utf8.csv 6.7MB
ershoufang-origin-utf8.csv 6.7MB
ershoufang_old.csv 5.4MB
ershoufang-origin-ansi.csv 5.4MB
ershoufang-origin-ansi.csv 5.4MB
ershoufang-clean-utf8-v1.1.csv 5.11MB
ershoufang-clean-utf8-v1.1.csv 5.11MB
ershoufang-clean-ansi-v1.1.csv 3.91MB
ershoufang-clean-ansi-v1.1.csv 3.91MB
latlng.csv 1.27MB
latlng - 副本.csv 1.17MB
ershoufang - 副本.csv 873KB
ershoufang.csv 12KB
testv1.csv 6KB
testv2.csv 4KB
ershoufang-mini-utf8.csv 3KB
ershoufang-mini-ansi.csv 2KB
nbww.docx 17KB
.gitattributes 93B
.gitignore 1KB
原始代码.html 7KB
k-means聚类结果分组4.html 3KB
k-means聚类结果分组4 - dark.html 3KB
南京二手房总价小于200万的分布图.html 3KB
k-means聚类结果分组3.html 3KB
k-means聚类结果分组1 - dark.html 3KB
k-means聚类结果分组0.html 3KB
k-means聚类结果分组0 - dark.html 3KB
k-means聚类结果分组2 - dark.html 3KB
k-means聚类结果分组3-dark.html 3KB
k-means聚类结果分组2.html 3KB
k-means聚类结果分组1.html 3KB
闪烁点.html 3KB
南京二手房总价热力图.html 2KB
南京二手房单价热力图.html 2KB
data_analysis.iml 718B
lianjia.iml 521B
house2.jpg 183KB
demo.jpg 161KB
house1.jpg 147KB
unitprice1.js 1.33MB
total.js 1.26MB
baidu_map_total.js 1.26MB
unitprice.js 1.2MB
cluster3.js 623KB
cluster3.js 623KB
xiaoyu201.js 388KB
xiaoyu201.js 388KB
cluster1.js 309KB
cluster1.js 309KB
cluster2.js 262KB
cluster2.js 262KB
cluster4.js 70KB
cluster4.js 70KB
cluster0.js 60KB
cluster0.js 60KB
README.md 930B
31f9bd59a9948b99ce4a68cb33c62637.png 722KB
e8fbbc9ebf9c99dc3228849a6c454f4e.png 326KB
83ebc8892cc133b6c2967b1680a949cb.png 222KB
5aa0e402894a90180243e461e6a39f95.png 204KB
48743e4e4d35f8e96e5b7ed47305c177.png 197KB
4a89d0cdd8af0769bf85ee809c13fdd5.png 187KB
聚类结果-单价与建筑面积散点图2.png 178KB
聚类结果-单价与建筑面积散点图.png 171KB
聚类结果-总价价与建筑面积散点图.png 117KB
聚类结果-总价价与建筑面积散点图2.png 109KB
不同k值下的总和方差折线图1.png 40KB
不同k值下的平方误差和.png 39KB
不同k值下的总和方差折线图2.png 37KB
3a4625cbb8d333691acd752dbac9f869.png 37KB
87ae2de4ca158afeaefc0d1533b29d5d.png 33KB
b4aae91db851ff529bcee3509315760f.png 13KB
432cf5efa4275deae4be1d4fd8239b3e.png 9KB
结果分享PPT.pptx 7.71MB
kmeans.py 9KB
run.py 7KB
spider_main.py 5KB
html_parser.py 4KB
house_attr.py 3KB
gaode_map.py 3KB
html_downloader.py 3KB
test_clean.py 2KB
pylot.py 2KB
html_outputer.py 2KB
test.py 2KB
business_attr.py 2KB
ciyun.py 1KB
log.py 1KB
url_manager.py 1023B
test.py 544B
cluster_analysis.py 167B
__init__.py 0B
simhei.ttf 9.3MB
HYQiHei-25J.ttf 2.02MB
2018-04-02 log.txt 8.95MB
ershoufang-clean-utf8-v1.0.txt 5.41MB
2018-04-01 log.txt 3.5MB
2018-03-22 log.txt 3.25MB
baidu_map_unitprice.txt 1.33MB
共 115 条
- 1
- 2
资源评论
荒野大飞
- 粉丝: 9359
- 资源: 416
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 01-spring-boot-overview
- vgg模型-基于深度学习AI算法对猫的动作行为识别-不含数据集图片-含逐行注释和说明文档.zip
- vgg模型-CNN图像分类识别人脸-不含数据集图片-含逐行注释和说明文档.zip
- Detect It Easy v3.03
- shufflenet模型-基于人工智能的卷积网络训练识别鞋类-不含数据集图片-含逐行注释和说明文档.zip
- shufflenet模型-python语言pytorch框架训练识别樱桃新鲜度-不含数据集图片-含逐行注释和说明文档.zip
- 优质资源,让 .NET 开发更简单,更通用,更流行
- resnet模型-基于深度学习对苹果颜色识别-不含数据集图片-含逐行注释和说明文档.zip
- mobilenet模型-基于图像分类算法对食物美食识别-不含数据集图片-含逐行注释和说明文档.zip
- ImmunityDebugger
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功