基于Python的中国城市轨道交通数据可视化分析源码+项目说明.zip

共35个文件

png：20个

html：4个

py：3个

版权申诉

毕业设计

python

人工智能

可视化

5星 · 超过95%的资源 26 浏览量 2023-08-10 10:56:01 上传评论 12 收藏 3.43MB ZIP 举报

【资源说明】基于Python的中国城市轨道交通数据可视化分析源码+项目说明.zip 基于Python的中国城市轨道交通数据可视化分析源码+项目说明.zip 基于Python的中国城市轨道交通数据可视化分析源码+项目说明.zip 1、该资源内项目代码都是经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用，也适合小白学习进阶，当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行，也可在此代码基础上进行修改，以实现其他功能。本项目是一个基于 Python 的简单数据可视化分析的小Demo。通过这个项目可以练习使用Python数据可视化分析相关的强大的库和模块，练习绘制简单的GUI界面并且连接数据库，更加深了对Python语言的学习和拓展。本项目也可作为学校的大作业、大实验实践或者课程设计等的选题项目。 > - 本项目通过多线程爬虫获取了高德地图中的中国轨道交通的一些数据信息，高德地图这个权威的网站也保证了数据的完整可靠性，然后进行了一些简单并且有趣的数据可视化分析，另外还设计了一个GUI界面，查询数据库或者文件中的一些信息。 > > - 如发现文档中或者源代码中有错误，欢迎大家在 `Issues` 中研究讨论，欢迎大家 `Fork` 和 `Pull requests` 改善代码，十分感谢！使用语言 - Python 主要技术 * **网络编程** * **多线程** * **文件操作** * **数据库编程** * **GUI** * **数据分析** 导入的库和模块 ```python import json import requests from bs4 import BeautifulSoup import sqlite import threading import tkinter as tk from tkinter import scrolledtext import pandas as pd from pyecharts import Line, Bar, Geo import numpy as np from wordcloud import WordCloud, ImageColorGenerator import jieba import matplotlib.pyplot as plt import seaborn as sns ``` 项目整体思路 1. 网页分析 2. 多线程爬虫爬取信息 . 数据保存至文件中和数据库中 4. 利用 tkinter 绘制 GUI 界面，实现查询线路和站点两个功能 5. 数据可视化分析（1）直接控制台显示分析结果（2）绘制中国地图、柱状图等，生成 .html 文件（）绘制词云（4）绘制柱状图、饼状图、折线图、散点图、双变量图等，生成 .png 文件运行 - 分别运行`src`文件夹中的`.py`文件即可部分运行结果样例 `res`文件夹中的文件

资源推荐

资源详情

资源评论

收起资源包目录

基于Python的中国城市轨道交通数据可视化分析源码+项目说明.zip （35个子文件）

项目说明.md 2KB

.gitattributes 94B

src

tree2.jpg 50KB

Search.py 3KB

Analyse.py 17KB

university.csv 326B

bg1.png 1.02MB

Spider.py 4KB

res

GUI界面1.png 266KB

已开通地铁城市分布情况.html 773KB

每个城市哪条线路的站点数最多.png 41KB

上海各线路站点数量的分布趋势.png 43KB

各个城市的站点数量的饼状图分布.png 184KB

武汉各线路站点数量的分布趋势.png 31KB

各城市各线路的站点数量前10的变化.png 45KB

中国地铁站最爱用的字.html 706KB

地铁名词云.jpg 47KB

哈尔滨各线路站点数量的分布趋势.png 27KB

分析各个城市的大学数量与站点数量的关系.png 53KB

北京各线路站点数量的分布趋势.png 32KB

各个城市的线路数量的饼状图分布.png 123KB

city_line.db 208KB

subway.csv 127KB

GUI界面2.png 203KB

各个城市的站点数量的散点图分布.png 46KB

郑州、武汉、广州、长沙同名的线路1-线路6的站点数量分布.png 91KB

各个城市的大学数量与站点数量的关系.png 26KB

地铁站最爱用门命名的城市.html 706KB

大学数量与站点数量的双变量图.png 14KB

city_line.db-journal 13KB

广州、天津、武汉、重庆同名的线路1-线路6的站点数量分布.png 91KB

全国各城市总的换乘站点数量（2换乘、3换乘、4换乘等）分布统计.png 23KB

天津各线路站点数量的分布趋势.png 31KB

名字中带有大学的地铁站的城市数量分布.png 21KB

各城市地铁线路数量分布.html 706KB

from wordcloud import WordCloud, ImageColorGenerator from pyecharts import Line, Bar, Geo import matplotlib.pyplot as plt import pandas as pd import numpy as np import jieba import seaborn as sns # 设置列名与数据对齐 pd.set_option('display.unicode.ambiguous_as_wide', True) pd.set_option('display.unicode.east_asian_width', True) # 显示10行 pd.set_option('display.max_rows', 10) # 读取数据 df = pd.read_csv('subway_all.csv', header=None, names=['city', 'line', 'station'], encoding='gbk') # 各个城市地铁线路情况 df_line = df.groupby(['city', 'line']).count().reset_index() print(df_line) def create_map(df): # 绘制地图 value = [i for i in df['line']] attr = [i for i in df['city']] geo = Geo("已开通地铁城市分布情况", title_pos='center', title_top='0', width=800, height=400, title_color="#fff", background_color="#404a59", ) geo.add("", attr, value, is_visualmap=True, visual_range=[0, 25], visual_text_color="#fff", symbol_size=15) geo.render("已开通地铁城市分布情况.html") def create_line(df): """ 生成城市地铁线路数量分布情况 """ title_len = df['line'] bins = [0, 5, 10, 15, 20, 25] level = ['0-5', '5-10', '10-15', '15-20', '20以上'] len_stage = pd.cut(title_len, bins=bins, labels=level).value_counts().sort_index() # 生成柱状图 attr = len_stage.index v1 = len_stage.values bar = Bar("各城市地铁线路数量分布", title_pos='center', title_top='18', width=800, height=400) bar.add("", attr, v1, is_stack=True, is_label_show=True) bar.render("各城市地铁线路数量分布.html") # 各个城市地铁线路数 df_city = df_line.groupby(['city']).count().reset_index().sort_values(by='line', ascending=False) print(df_city) create_map(df_city) create_line(df_city) # 哪个城市哪条线路地铁站最多 print(df_line.sort_values(by='station', ascending=False)) # 去除重复换乘站的地铁数据 df_station = df.groupby(['city', 'station']).count().reset_index() print(df_station) # 统计每个城市包含地铁站数(已去除重复换乘站) print(df_station.groupby(['city']).count().reset_index().sort_values(by='station', ascending=False)) def create_wordcloud(df): """ 生成地铁名词云 """ # 分词 text = '' for line in df['station']: text += ' '.join(jieba.cut(line, cut_all=False)) text += ' ' backgroud_Image = plt.imread('tree2.jpg') wc = WordCloud( background_color='white', mask=backgroud_Image, font_path='STXINGKA.TTF', max_words=1000, max_font_size=150, min_font_size=15, prefer_horizontal=1, random_state=50, ) wc.generate_from_text(text) img_colors = ImageColorGenerator(backgroud_Image) wc.recolor(color_func=img_colors) # 看看词频高的有哪些 process_word = WordCloud.process_text(wc, text) sort = sorted(process_word.items(), key=lambda e: e[1], reverse=True) print(sort[:50]) plt.imshow(wc) plt.axis('off') wc.to_file("地铁名词云.jpg") print('生成词云成功!') create_wordcloud(df_station) words = [] for line in df['station']: for i in line: # 将字符串输出一个个中文 words.append(i) def all_np(arr): """ 统计单字频率 """ arr = np.array(arr) key = np.unique(arr) result = {} for k in key: mask = (arr == k) arr_new = arr[mask] v = arr_new.size result[k] = v return result def create_word(word_message): """ 生成柱状图 """ attr = [j[0] for j in word_message] v1 = [j[1] for j in word_message] bar = Bar("中国地铁站最爱用的字", title_pos='center', title_top='18', width=800, height=400) bar.add("", attr, v1, is_stack=True, is_label_show=True) bar.render("中国地铁站最爱用的字.html") word = all_np(words) word_message = sorted(word.items(), key=lambda x: x[1], reverse=True)[:10] create_word(word_message) # 选取上海的地铁站 df1 = df_station[df_station['city'] == '上海'] print(df1) # 选取上海地铁站名字包含路的数据 df2 = df1[df1['station'].str.contains('路')] print(df2) # 选取武汉的地铁站 df1 = df_station[df_station['city'] == '武汉'] print(df1) # 选取武汉地铁站名字包含家的数据 df2 = df1[df1['station'].str.contains('家')] print(df2) # 选取重庆的地铁站 df1 = df_station[df_station['city'] == '重庆'] print(df1) # 选取重庆地铁站名字包含家的数据 df2 = df1[df1['station'].str.contains('家')] print(df2) # 选取哈尔滨的地铁站 df1 = df_station[df_station['city'] == '哈尔滨'] print(df1) # 选取哈尔滨地铁站名字包含家的数据 df2 = df1[df1['station'].str.contains('路')] print(df2) # 选取哈尔滨的地铁站 df1 = df_station[df_station['city'] == '哈尔滨'] print(df1) # 选取哈尔滨地铁站名字包含家的数据 df2 = df1[df1['station'].str.contains('街')] print(df2) def create_door(door): """ 生成柱状图 """ attr = [j for j in door['city'][:3]] v1 = [j for j in door['line'][:3]] bar = Bar("地铁站最爱用“门”命名的城市", title_pos='center', title_top='18', width=800, height=400) bar.add("", attr, v1, is_stack=True, is_label_show=True, yaxis_max=40) bar.render("地铁站最爱用门命名的城市.html") # 选取地铁站名字包含门的数据 df1 = df_station[df_station['station'].str.contains('门')] # 对数据进行分组计数 df2 = df1.groupby(['city']).count().reset_index().sort_values(by='line', ascending=False) print(df2) create_door(df2) # 选取北京的地铁站 df1 = df_station[df_station['city'] == '北京'] print(df1) # 选取北京地铁站名字包含门的数据 df2 = df1[df1['station'].str.contains('门')] print(df2) # 选取南京的地铁站 df1 = df_station[df_station['city'] == '南京'] # 选取南京地铁站名字包含门的数据 df2 = df1[df1['station'].str.contains('门')] print(df2) # 选取西安的地铁站 df1 = df_station[df_station['city'] == '西安'] # 选取西安地铁站名字包含门的数据 df2 = df1[df1['station'].str.contains('门')] print(df2) #选取数量前5个名字中带有大学的地铁站的城市，并绘制柱状图 df1=df[df['station'].str.contains('大学')] city_counts=df1['city'].value_counts() plt.figure(figsize=(10,5)) labelline=list(city_counts[:5].index)# print(labelline)#['上海', '沈阳', '北京', '天津', '重庆'] plt.xlabel('城市') plt.ylabel('站点数量') plt.title('名字中带有大学的地铁站的城市数量分布') plt.bar([i for i in labelline],city_counts[:5]) # 汉字字体，优先使用楷体，找不到则使用黑体 plt.rcParams['font.sans-serif'] = ['Kaitt', 'SimHei'] # 正常显示负号 plt.rcParams['axes.unicode_minus'] = False plt.savefig('./名字中带有大学的地铁站的城市数量分布') #绘制北京、武汉、天津、上海等各线路站点数量的折线图趋势分布 #北京： df1=df[df['city']=='北京'] Bei_station=df1['line'].value_counts() print(Bei_station) plt.figure(figsize=(12,6)) labelline=list(Bei_station[:8].index) plt.xlabel=('线路') plt.ylabel=('各站点数量') plt.title("北京各线路站点数量的分布趋势") plt.plot([i for i in labelline],Bei_station[:8]) plt.savefig('./北京各线路站点数量的分布趋势') #plt.show() #武汉 df1=df[df['city']=='武汉'] Wu_station=df1['line'].value_counts() print(Wu_station) plt.figure(figsize=(12,6)) labelline=list(Wu_station[:8].index) plt.xlabel=('线路') plt.ylabel=('各站点数量') plt.title("武汉各线路站点数量的分布趋势") plt.plot([i for

评论收藏

内容反馈

版权申诉

2301_77342543

2023-12-12

资源是宝藏资源，实用也是真的实用，感谢大佬分享~

Make程序设计
上传者
2023-12-19

感谢支持！
Eau_Douce

2023-12-09

资源有一定的参考价值，与资源描述一致，很实用，能够借鉴的部分挺多的，值得下载。

Make程序设计
上传者
2023-12-19

感谢认可加油啊