# Python_second-hand_house_Visualization_Analysis
基于Python的南京二手房数据采集及可视化分析设计
## 开发环境:Pycharm工具,Python3.7环境
### 1 内容简介
首先通过爬虫采集链家网上所有南京二手房的房源数据,并对采集到的数据进行清洗;然后,对清洗后的数据进行可视化分析,探索隐藏在大量数据背后的规律;最后,采用一个聚类算法对所有二手房数据进行聚类分析,并根据聚类分析的结果,将这些房源大致分类,以对所有数据的概括总结。通过上述分析,我们可以了解到目前市面上二手房各项基本特征及房源分布情况,帮助我们进行购房决策。
### 2 应用技术介绍
(1)Python网络爬虫技术
Requests
Beautifulsoup
(2)Python数据分析技术
Numpy
Matplotlib
Pandas
(3)k-means聚类算法
(4)高德地图开发者应用JS API
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
## 开发环境:Pycharm工具,Python3.7环境 ### 1 内容简介 首先通过爬虫采集链家网上所有南京二手房的房源数据,并对采集到的数据进行清洗;然后,对清洗后的数据进行可视化分析,探索隐藏在大量数据背后的规律;最后,采用一个聚类算法对所有二手房数据进行聚类分析,并根据聚类分析的结果,将这些房源大致分类,以对所有数据的概括总结。通过上述分析,我们可以了解到目前市面上二手房各项基本特征及房源分布情况,帮助我们进行购房决策。 ### 2 应用技术介绍 (1)Python网络爬虫技术 Requests Beautifulsoup (2)Python数据分析技术 Numpy Matplotlib Pandas (3)k-means聚类算法 (4)高德地图开发者应用JS API
资源推荐
资源详情
资源评论
收起资源包目录
基于Python的南京二手房数据采集及可视化分析设计 (113个子文件)
ershoufang-origin-utf8.csv 6.7MB
ershoufang-origin-utf8.csv 6.7MB
ershoufang_old.csv 5.4MB
ershoufang-origin-ansi.csv 5.4MB
ershoufang-origin-ansi.csv 5.4MB
ershoufang-clean-utf8-v1.1.csv 5.11MB
ershoufang-clean-utf8-v1.1.csv 5.11MB
ershoufang-clean-ansi-v1.1.csv 3.91MB
ershoufang-clean-ansi-v1.1.csv 3.91MB
latlng.csv 1.27MB
latlng - 副本.csv 1.17MB
ershoufang - 副本.csv 873KB
ershoufang.csv 12KB
testv1.csv 6KB
testv2.csv 4KB
ershoufang-mini-utf8.csv 3KB
ershoufang-mini-ansi.csv 2KB
.gitattributes 93B
.gitignore 1KB
原始代码.html 7KB
k-means聚类结果分组4.html 3KB
k-means聚类结果分组4 - dark.html 3KB
南京二手房总价小于200万的分布图.html 3KB
k-means聚类结果分组3.html 3KB
k-means聚类结果分组0 - dark.html 3KB
k-means聚类结果分组1 - dark.html 3KB
k-means聚类结果分组0.html 3KB
k-means聚类结果分组2 - dark.html 3KB
k-means聚类结果分组3-dark.html 3KB
k-means聚类结果分组2.html 3KB
k-means聚类结果分组1.html 3KB
闪烁点.html 3KB
南京二手房总价热力图.html 2KB
南京二手房单价热力图.html 2KB
data_analysis.iml 718B
lianjia.iml 521B
house2.jpg 183KB
house1.jpg 147KB
unitprice1.js 1.33MB
total.js 1.26MB
baidu_map_total.js 1.26MB
unitprice.js 1.2MB
cluster3.js 623KB
cluster3.js 623KB
xiaoyu201.js 388KB
xiaoyu201.js 388KB
cluster1.js 309KB
cluster1.js 309KB
cluster2.js 262KB
cluster2.js 262KB
cluster4.js 70KB
cluster4.js 70KB
cluster0.js 60KB
cluster0.js 60KB
README.md 930B
31f9bd59a9948b99ce4a68cb33c62637.png 722KB
e8fbbc9ebf9c99dc3228849a6c454f4e.png 326KB
83ebc8892cc133b6c2967b1680a949cb.png 222KB
5aa0e402894a90180243e461e6a39f95.png 204KB
48743e4e4d35f8e96e5b7ed47305c177.png 197KB
4a89d0cdd8af0769bf85ee809c13fdd5.png 187KB
聚类结果-单价与建筑面积散点图2.png 178KB
聚类结果-单价与建筑面积散点图.png 171KB
聚类结果-总价价与建筑面积散点图.png 117KB
聚类结果-总价价与建筑面积散点图2.png 109KB
不同k值下的总和方差折线图1.png 40KB
不同k值下的平方误差和.png 39KB
不同k值下的总和方差折线图2.png 37KB
3a4625cbb8d333691acd752dbac9f869.png 37KB
87ae2de4ca158afeaefc0d1533b29d5d.png 33KB
b4aae91db851ff529bcee3509315760f.png 13KB
432cf5efa4275deae4be1d4fd8239b3e.png 9KB
结果分享PPT.pptx 7.71MB
kmeans.py 9KB
run.py 7KB
spider_main.py 5KB
html_parser.py 4KB
house_attr.py 3KB
gaode_map.py 3KB
html_downloader.py 3KB
test_clean.py 2KB
pylot.py 2KB
html_outputer.py 2KB
test.py 2KB
business_attr.py 2KB
ciyun.py 1KB
log.py 1KB
url_manager.py 1023B
test.py 544B
cluster_analysis.py 167B
__init__.py 0B
simhei.ttf 9.3MB
HYQiHei-25J.ttf 2.02MB
2018-04-02 log.txt 8.95MB
ershoufang-clean-utf8-v1.0.txt 5.41MB
2018-04-01 log.txt 3.5MB
2018-03-22 log.txt 3.25MB
baidu_map_unitprice.txt 1.33MB
star.txt 225KB
star.txt 225KB
共 113 条
- 1
- 2
资源评论
程序源码工
- 粉丝: 47
- 资源: 469
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功