AQI 分析报告
1. 数据介绍
本次使用的空气质量指数数据介绍:
AQI 指数(空气质量指数)AQI 的指数的取值范围为 0~500,其中 0~50、51~100、
101~200、201~300 和大于 300,分别对应国家空气质量标准中日均值的 I 级、II 级、III 级、
IV 级和 V 级标准的污染物浓度限定数值。
六项污染物质的浓度:其中 PM2.5(粒径小于等于 2.5μm 的颗粒物,也称细颗粒物),
PM10(粒径小于等于 10μm 的颗粒物,也称可吸入颗粒物),SO2(二氧化硫),NO2(二
氧化氮)以及 CO(一氧化碳)的浓度全部为 24 小时平均值,O3 浓度值为 8 小时的滑动平
均值。
时间跨度:2018 年 1 月 1 日至 2018 年 12 月 31 日,共有 365 条记录。
接下来首先通过 R 语言加载数据:
library('xlsx')
library('ggplot2')
library('gridExtra')
library('lubridate')
data = read.xlsx('F://R//aqi_beijing.xlsx','2018.01-12',encoding = 'gbk')
names(data)
colnames(data) <- c("日期","AQI","PM2.5","PM10","SO2","CO","NO2","O3_8h")
summary(data)
2. Aqi 二分类处理
本次分析,我们使用逻辑回归进行分析,aqi 目前是连续值,因此我们把 aqi 分类为无
污染和有污染,首先,我们查看 aqi 的最大值和最小值,分别是 0 和 294,因此我们根据上
面的 aqi 分层划分,把小于 150 的定义为无污染,用 0 表示,把大于等于 150 的定义为有污
染,用 1 表示。
关键代码如下:
# 获取 aqi 值
aqi <- data[,2]
# 获取 aqi 的最大值和最小值
min(aqi)
max(aqi)
# 把 aqi 小于 150 的替换成 0,表示无污染,大于 150 的替换成 1,表示有污染
aqi[which(aqi<150)] <- 0
评论0
最新资源