【免费】ARIMA时间序列预测模型Python代码_arima时间序列预测资源-CSDN文库

共1个文件

txt：1个

python

ARIMA

需积分: 0 34 浏览量 2023-12-01 14:01:32 上传评论收藏 2KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

ARIMA时间序列预测模型Python代码.zip （1个子文件）

ARIMA时间序列预测模型Python代码.txt 4KB

import pandas # 读取数据，指定日期为索引列 data = pandas.read_csv( 'D:\\DATA\\pycase\\number2\\9.3\\Data.csv' , index_col='日期' ) # 绘图过程中 import matplotlib.pyplot as plt # 用来正常显示中文标签 plt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示负号 plt.rcParams['axes.unicode_minus'] = False # 查看趋势图 data.plot() #有增长趋势，不平稳 # 附加：查看自相关系数合片自相关系数（查分之后），可以用于平稳性的检测，也可用于定阶系数预估 #自相关图（） from statsmodels.graphics.tsaplots import plot_acf plot_acf(data).show() #自相关图既不是拖尾也不是截尾。以上的图的自相关是一个三角对称的形式，这种趋势是单调趋势的典型图形，说明这个序列不是平稳序列 # 1 平稳性检测 from statsmodels.tsa.stattools import adfuller as ADF def tagADF(t): result = pandas.DataFrame(index=[ "Test Statistic Value", "p-value", "Lags Used", "Number of Observations Used", "Critical Value(1%)", "Critical Value(5%)", "Critical Value(10%)" ], columns=['销量'] ); result['销量']['Test Statistic Value'] = t[0] result['销量']['p-value'] = t[1] result['销量']['Lags Used'] = t[2] result['销量']['Number of Observations Used'] = t[3] result['销量']['Critical Value(1%)'] = t[4]['1%'] result['销量']['Critical Value(5%)'] = t[4]['5%'] result['销量']['Critical Value(10%)'] = t[4]['10%'] return result; print('原始序列的ADF检验结果为:',tagADF(ADF(data[u'销量']))) # 添加标签后展现 # 平稳判断：得到统计量大于三个置信度(1%,5%,10%)临界统计值，p值显著大于0.05，该序列为非平稳序列。 # 备注：得到的统计量显著小于3个置信度（1%，5%，10%）的临界统计值时，为平稳此时p值接近于0 此处不为0，尝试增加数据量，原数据太少 # 2 进行数据差分，一般一阶差分就可以 D_data = data.diff(1).dropna() D_data.columns = [u'销量差分'] #差分图趋势查看 D_data.plot() plt.show() # 附加：查看自相关系数合片自相关系数（查分之后），可以用于平稳性的检测，也可用于定阶系数预估 #自相关图 plot_acf(D_data).show() plt.show() #偏自相关图 from statsmodels.graphics.tsaplots import plot_pacf plot_pacf(D_data).show() # 3 平稳性检测 print(u'差分序列的ADF检验结果为：', tagADF(ADF(D_data[u'销量差分']))) # 解释：Test Statistic Value值小于两个水平值，p值显著小于0.05，一阶差分后序列为平稳序列。 # 4 白噪声检验 from statsmodels.stats.diagnostic import acorr_ljungbox #返回统计量和p值 print(u'差分序列的白噪声检验结果为：', acorr_ljungbox(D_data, lags=1)) # 分别为stat值（统计量）和P值 # P值小于0.05，所以一阶差分后的序列为平稳非白噪声序列。 # 5 p，q定阶 from statsmodels.tsa.arima_model import ARIMA #一般阶数不超过length/10 pmax = int(len(D_data)/10) #一般阶数不超过length/10 qmax = int(len(D_data)/10) #bic矩阵 bic_matrix = [] for p in range(pmax+1): tmp = [] for q in range(qmax+1): #存在部分报错，所以用try来跳过报错。 try: tmp.append(ARIMA(data, (p,1,q)).fit().bic) except: tmp.append(None) bic_matrix.append(tmp) #从中可以找出最小值 bic_matrix = pandas.DataFrame(bic_matrix) #先用stack展平，然后用idxmin找出最小值位置。 p,q = bic_matrix.stack().idxmin() print(u'BIC最小的p值和q值为：%s、%s' %(p,q)) # 取BIC信息量达到最小的模型阶数，结果p为0，q为1，定阶完成。 # 6 建立模型和预测 model = ARIMA(data, (p,1,q)).fit() #给出一份模型报告 model.summary2() #作为期5天的预测，返回预测结果、标准误差、置信区间。 model.forecast(5)

评论收藏

内容反馈