python数据分析实战之AQI预测_城市空气质量分析与预测资源-CSDN文库

版权申诉

python

python数据分析

5星 · 超过95%的资源 111 浏览量 2020-12-21 08:06:16 上传评论 12 收藏 194KB PDF 举报

资源详情

资源评论

python数据分析实战之数据分析实战之AQI预测预测

前言：上一篇对AQI进行了分析，这一篇根据对以往的数据，建立一个模型，可以将模型应用于未知的数据，来进行AQI的预

测。

文章目录文章目录1、加载相关库和数据集2、数据处理和转换2.1 简单的数据处理2.2 数据转换3、建立基模型4、特征选择4.1 RFECV4.2

使用RFECV进行特征选择5、异常值处理5.1 使用临界值进行填充5.2 分箱离散化6 、残差图分析6.1 异方差性6.2 离群点

1、加载相关库和数据集、加载相关库和数据集

使用的库主要有：pandas、numpy、matplotlib、seaborn、sklearn

使用的数据集：2015年空气质量指数（AQI）数据集

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

import warnings

sns.set(style="darkgrid")

plt.rcParams["font.family"] = "SimHei" # 设置可以显示中文字体

plt.rcParams["axes.unicode_minus"] = False

warnings.filterwarnings("ignore") # 忽略警告信息

data = pd.read_csv("AQI_data.csv") # AQI历史数据集

2、数据处理和转换、数据处理和转换

2.1 简单的数据处理简单的数据处理

# 空值、重复值处理

data.fillna({"Precipitation": data["Precipitation"].median()}, inplace=True)

data.drop_duplicates(inplace=True)

2.2 数据转换数据转换

对于模型来说，内部进行的都是数学上的运算，所以在进行建模之前，我们需要对类别变量进行数据转换，变成离散变量。

# 将类别变量（是，否）转成离散变量（1，0）

data["Coastal"] = data["Coastal"].map({"是": 1, "否": 0})

data["Coastal"].value_counts()

3、建立基模型、建立基模型

不进行任何处理，建立一个基模型，后续的操作都可以在此基础上进行改进。

from sklearn.linear_model import LinearRegression

from sklearn.model_selection import train_test_split

X = data.drop(["City","AQI"], axis=1) # 城市名称对结果不会有影响，所以去除城市列

y = data["AQI"] # 切分训练集和测试集

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=0)

lr = LinearRegression()

lr.fit(X_train, y_train) # 使用训练集训练模型

print("训练集R^2：",lr.score(X_train, y_train))

print("测试集R^2：",lr.score(X_test, y_test))

------------------------

训练集R^2： 0.4685357478390665

测试集R^2： 0.3075998035417721

y_hat = lr.predict(X_test)

plt.figure(figsize=(15, 5))

plt.plot(y_test.values, "-r", label="真实值", marker="o")

plt.plot(y_hat, "-g", label="预测值", marker="D")

plt.legend(loc="upper left")

plt.title("线性回归预测结果", fontsize=20)

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余5页未读，立即下载

评论收藏

内容反馈

版权申诉

loeng#qf

2024-03-25

资源是宝藏资源，实用也是真的实用，感谢大佬分享~

python数据分析实战之AQI预测

评论3

最新资源

python数据分析实战之AQI预测

评论3

最新资源

相关推荐

Python实现基于RF随机森林的AQI预测模型（完整源码和数据）

Python实现基于SVR支持向量机回归的AQI预测模型（完整源码和数据）

python数据分析实战之AQI分析

Python实现基于LSTM长短期记忆神经网络的AQI预测模型（完整源码和数据）

Python实现基于MLR多元线性回归的AQI预测模型（完整源码和数据）

python 空气质量AQI 数据分析与预测----用到的库，数据集，数据清洗-附件资源

python获取空气质量指数

python-aqi:一个在AQI值和污染物浓度（µgm³或ppm）之间转换的库

爬取全国空气质量监测网代码.py

基于 LSTM、MLR、SVR、随机森林、梯度提升树的 AQI 预测（Python完整源码和数据）

Python实现基于GradientBoosting的AQI预测模型（完整源码和数据）

基于LSTM的AQI预测（Python完整源码）

AQI:做 AQI 预测

数据分析理论流程AQI.xmind

Python数据分析练习：北京、广州PM2.5空气质量分析

python城市空气质量CSV文件训练和预测.txt

python获取全国城市pm2.5、臭氧等空气质量过程解析

Python获取PM2.5的实时数据

基于机器学习的Pm2.5图像分析及估计

Python-每6小时自动获取空气质量若aqi超过150触发短信提示

城市空气质量可视化分析实现

本溪市大气污染物浓度预测

FDN-Learning:我们的模型利用多城市的历史空气污染物和气象数据来预测未来的污染物浓度

使用BP神经网络实现6种常规空气污染物浓度预测

基于BP神经网络的西安环境空气质量的预测

AQI计算公式

RNN-污染-预测：使用简单的递归神经网络，Python和Keras的LSTM和GRU预测下一个小时，一周和一个月的污染

空气中PM2.5的评价预测模型