## 准备工作
```python
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.linear_model import LinearRegression
import seaborn as sns
from pyecharts.charts import Bar
from pyecharts import options as opts
from pyecharts.charts import Map
from pyecharts.charts import Timeline
from pyecharts.charts import Line
from pyecharts.charts import Pie
from pyecharts.globals import SymbolType
from pyecharts.commons.utils import JsCode
```
numpy、matplotlib、pandas 三大库的导入是为了后面数据的处理,seaborn、pyecharts 库的导入是为了将数据更加精美的可视化。sklearn 库是为了后面构建模型需要导入的库。
## 数据导入
```python
China_main_city=pd.read_csv('./data/中国主要城市经济统计数据 2012-2021.csv')
China_area=pd.read_excel('./data/1997—2018年县域社会经济主要指标面板数据.xlsx')
USA_state=pd.read_csv('./data/usa_states_summary.csv')
USA_industry=pd.read_csv('./data/usa_states_gdp_by_industry.csv')
```
将数据导入,并赋给不同的变量。
- 中国主要城市经济统计数据2012-2021 赋给变量China_main_City
- 1997—2018 年县域社会经济主要指标面板数据赋给变量China_area
- usa_states_summary 数据赋给变量USA_state
- usa_states_gdp_by_industry 赋给变量 USA_industry
## 对比分析
### 对比分析 2022 年美国各州与中国主要城市的经济
#### GDP 分析
```python
China_main_city.head(20)
```
![image.png](https://cdn.nlark.com/yuque/0/2024/png/2469055/1708330909931-6e5d10b9-72c1-4082-a709-1c036ddac7e0.png#averageHue=%23f0f0f0&clientId=u3f8ff922-59bb-4&from=paste&height=389&id=u23f675ae&originHeight=486&originWidth=1360&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=33827&status=done&style=none&taskId=u90378807-0b40-4a93-abf9-597b96b0bbc&title=&width=1088)
```python
USA_industry.head()
```
![image.png](https://cdn.nlark.com/yuque/0/2024/png/2469055/1708330937798-73cc1734-7319-4662-97af-94b15bf638d3.png#averageHue=%23f0f0f0&clientId=u3f8ff922-59bb-4&from=paste&height=142&id=u910a7a60&originHeight=177&originWidth=1374&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=11258&status=done&style=none&taskId=u6ea7d7ae-80d1-4b6b-8176-8ce46a37219&title=&width=1099.2)
```python
USA_state.head()
```
![image.png](https://cdn.nlark.com/yuque/0/2024/png/2469055/1708330964052-0bec5031-aa6f-4526-81d8-fe13cc401feb.png#averageHue=%23f0f0f0&clientId=u3f8ff922-59bb-4&from=paste&height=128&id=u64045d9d&originHeight=160&originWidth=1255&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=9800&status=done&style=none&taskId=ue705af9b-d54b-4c1b-b782-3c4278bc02a&title=&width=1004)
查看usa_states_summary.csv数据集是否有缺失值,如有则进行填充
```python
np.any(pd.isnull(USA_state))
```
![image.png](https://cdn.nlark.com/yuque/0/2024/png/2469055/1708331021157-acb693c7-a9c9-4e39-8c40-0ad46a147575.png#averageHue=%23f8f8f8&clientId=u3f8ff922-59bb-4&from=paste&height=34&id=u0b9622b3&originHeight=42&originWidth=110&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=356&status=done&style=none&taskId=u60f09483-81a7-4d05-afc0-a2ea6b9180e&title=&width=88)
```python
China_main_city=China_main_city.set_index('城市')
China_main_city.index
```
![image.png](https://cdn.nlark.com/yuque/0/2024/png/2469055/1708331104579-76a0ee0d-9c67-4078-b3ec-140650df6ff9.png#averageHue=%23efefef&clientId=u3f8ff922-59bb-4&from=paste&height=85&id=ufcac3cde&originHeight=106&originWidth=910&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=3785&status=done&style=none&taskId=ueec3c900-87ba-4c28-a9be-34f1d22d85e&title=&width=728)
```python
city=np.unique(China_main_city.index)
```
![image.png](https://cdn.nlark.com/yuque/0/2024/png/2469055/1708331139840-2a8f0222-e07f-4b15-8c63-c9573e92a58c.png#averageHue=%23ebebeb&clientId=u3f8ff922-59bb-4&from=paste&height=60&id=uddcbec22&originHeight=75&originWidth=1077&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=6010&status=done&style=none&taskId=uecf6f4ce-5cce-4a50-9d2b-9771402329e&title=&width=861.6)
##### 中国方面
###### 中国主要城市地区生产总值
```python
#将2021年中国主要城市的数据赋给变量city_2021
city_2021=China_main_city[China_main_city['年份']=='2021年']
city_2021=city_2021.reset_index()
#将2021年中国主要城市的GDP数据赋给变量city_2021_gdp
city_2021_gdp=city_2021[['城市','地区生产总值(当年价格)(亿元)']]
#将2021年中国主要城市GDP数据可视化
def get_pl_bar2(city_2021_gdp):
sort_info = city_2021_gdp.sort_values(by='地区生产总值(当年价格)(亿元)', ascending=True)
c = (
#…………
)
return c
get_pl_bar2(city_2021_gdp)
```
![image.png](https://cdn.nlark.com/yuque/0/2024/png/2469055/1708331275491-370132ac-b60e-497a-b5cf-f989a8d629a7.png#averageHue=%23e0e5f2&clientId=u3f8ff922-59bb-4&from=paste&height=471&id=u58e0b6fd&originHeight=589&originWidth=1146&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=25390&status=done&style=none&taskId=uad73a0c3-0352-457b-a166-ea0010b5781&title=&width=916.8)
通过分析 2021 年中国主要城市地区生产总值,可以发现 2021 年上海、北京、深圳、广州是位距前四的,因此接下来我们将挑选这四个城市去分析2022 年的 GDP 情况。
取上海、北京、深圳、广州 2012-2021 年的 GDP 数据。
```python
#取上海2012-2021年的GDP数据
shanghai_gdp=China_main_city['地区生产总值(当年价格)(亿元)']['上海']
shanghai_gdp=shanghai_gdp.values
print(shanghai_gdp)
#取北京2012-2021年的GDP数据
beijing_gdp=China_main_city['地区生产总值(当年价格)(亿元)']['北京']
beijing_gdp=beijing_gdp.values
print(beijing_gdp)
#取广州2012-2021年的GDP数据
guangzhou_gdp=China_main_city['地区生产总值(当年价格)(亿元)']['广州']
guangzhou_gdp=guangzhou_gdp.values
print(guangzhou_gdp)
#取深圳2012-2021年的GDP数据
shenzhen_gdp=China_main_city['地区生产总值(当年价格)(亿元)']['深圳']
shenzhen_gdp=shenzhen_gdp.values
print(shenzhen_gdp)
year=[i for i in range(2012,2022)]
print(year)
```
![image.png](https://cdn.nlark.com/yuque/0/2024/png/2469055/1708331704788-71bc9d23-1342-411c-84ab-1f7d8d85576a.png#averageHue=%23ededed&clientId=u3f8ff922-59bb-4&from=paste&height=145&id=u69379ca3&originHeight=181&originWidth=799&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=8093&status=done&style=none&taskId=u07bddfd3-ead6-485a-b11f-46a8e053aaf&title=&width=639.2)
根据北京、上海、广州、深圳这四个城市2011-2021年的gdp数据,构建回归模型,分别预测其2022年gdp数据。
```python
#北京
x_bj=np.array(year).reshape(-1,1)
y_bj=beijing_gdp
model_bj=LinearRegression()
model_bj.fit(x_bj,y_bj)
x_new_bj=np.array([[2022]])
y_pred_bj=model_bj.predict(x_new_bj)
print(f"预测的2022年的北京GDP为:{y_pred_bj[0]}")
bj_2022_gdp=y_pred_bj[0]
#深圳
x_sz=np.array(year).reshape(-1,1)
y_sz=shenzhen_gdp
model_sz=LinearRegression()
model_sz.fit(x_sz,y_sz)
x_new_sz=np.array([[2022]])
y_pred_sz=model_sz.predict(x_new_sz)
print(f"预测的2022年的深圳GDP为:{y_pred_sz[0]}")
sz_2022_gdp=y_pred_sz[0]
#广州
x_gz=np.array(year).reshape(-1,1)
y_gz=guangzhou_gdp
model_gz=LinearRegression()
model_gz.fit(x_gz,y_gz)
x_new_gz=np.array([[2022]])
y_pred_gz=model_gz.predict(x_new_gz)
print(f"预测的2022年的广州GDP为:{y_pred_gz[0]}")
gz_2022_gdp=y_pred_gz[0]
#上海
x_sh=np.array(year).reshape(-1,1)
y_sh=shanghai_gdp
model_sh=LinearRegression()
model_sh.fit(x_sh,y_sh)
x_new_sh=np.array([[2022]])
y_pred_sh=model_sh.predict(x_new_sh)
print(f"预测的2022年的上海GDP为:{y_pred_sh[0]}")
sh_2022_gdp=y_pred_sh[0]
```
![image.png](https://cdn.nlark.com/yuque/0/2024/png/2469055/1708331765557-0c4b701e-cf1a-49d7-9955-30ad8c56d717.png#averageHue=%23dcdcdc&clientId=u3f8ff922-59bb-4&from=paste&height=68&id=u5c0c0c3b&originHeight=85&originWidth=456&origina
神仙别闹
- 粉丝: 4333
- 资源: 7532
最新资源
- 电子工程中差动放大电路的性能测试与分析
- 8PSK调制解调通信链路matlab误码率仿真【包括程序,中文注释,程序操作和讲解视频】
- BLDC无刷直流电机电流滞环控制 1.转速环采用pi控制,电流环采用滞环控制 2.提供参考文献和仿真模型;
- 电子工程技术中的电压比较器实验及特性研究
- 4-20mA采集电路,主控为STM32F103,RS485输出 提供原理图和pcb源文件(AD设计),以及源码,包含ADC采样代码,RS485代码等,带隔离功能 备注:精通各种运放的使用,支持其他
- 模拟电子技术中负反馈放大电路的实验研究及其性能优化方法
- 电子工程技术-集成运算放大器的基本运算电路实验研究与仿真实践
- 风光柴储微网优化调度模型(matlb程序),粒子群多目标优化. 程序注释清晰明了,适合研究微网优化调度,微网容量配置方向基础入门的同学
- STM32CubeMX图形化配置与代码生成功能在嵌入式开发的应用
- ouc2024攻防先导作业
- 模拟电子技术-单管共射放大电路实验报告-掌握静态工作点与放大性能的测量方法
- 基于51单片机的直流电机调速仿真 通过调节滑动变阻器控制电机转动速度 没有速度值显示 包括源程序,仿真,proteus软件包 送相关文档资料(不是对应配套的,仅供参考,自行整合取舍使用)
- 模拟电子技术-射极跟随器:特性、原理及其实验方法详解
- ouc2024秋攻防先导作业
- 嵌入式开发中STM32CubeMX图形化配置与代码生成功能详解及其应用
- simulink模块汇总梳理 , 智能座舱域在AUTOSAR 框架中应用层的开发依赖于simulink建模,通过simulink模型设计加上C代码生成来完成繁杂的应用层开发 因此simulink计
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈