《表1 分解后时间序列平稳性检验结果》

《表1 分解后时间序列平稳性检验结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于TEI@I方法论的航空客运需求预测模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:Δ表示取一阶差分;Δ2表示取二阶差分;ln表示取对数;(c,t,k)中c、t、k分别表示单位根检验中的截距项、时间趋势项和最大滞后阶数,k的选择以AIC最小为准则;在5%的水平下判断序列是否平稳。

本文模型第二步为数据特征分析,即对各个子序列分别进行平稳性和复杂性检测。对于序列的平稳性,本文采用了最常用的ADF单位根检验,表1为两个机场分解后数据序列的平稳性检验结果。从表1可以看到,上海浦东机场IMF5序列二阶差分不平稳,其余序列(IMF1、IMF2、IMF3、IMF4、IMF6和残差)在95%的置信水平下是平稳或对数平稳的;深圳宝安机场的IMF序列平稳或对数平稳的有IMF1、IMF2、IMF3、IMF4和残差,一阶差分平稳的有IMF5和IMF6。关于序列的复杂性,本文采用样本熵进行刻画,上海浦东机场和深圳宝安机场分解后数据的复杂性检验结果如表2所示。由前文样本熵模型介绍可知,样本熵的值越大,说明序列的复杂度越高。当序列的波动较大并且复杂度在一个相对较高的水平(可设置一个样本熵阈值)时,考虑采用善于捕捉非线性特征的人工智能模型进行预测。通过观察图3中各IMF序列的波动情况,本文中将该样本熵的阈值设置为0.3,原因如下:一方面考虑到样本熵值小于0.3的各序列线性特征比较明显,而且平稳,比较符合计量经济学模型建模要求,而如果将阈值设置太高,则可能导致本该用人工智能模型进行预测的序列最终采用了计量经济学模型进行预测,影响模型的预测效果;另一方面,考虑到后续需要对采用人工智能模型进行预测的序列进行聚类重构,并根据是否具有长程相关性选择采用LSTM模型或BP模型进行预测,如果将阈值设置太高,那么参与聚类重构的序列的数量会比较少,将可能导致最终模型预测效果相比基准模型得不到大的提升。也就是说,当时间序列具有平稳性且样本熵值小于0.3时,用计量经济学模型进行预测,其他的则采用人工智能模型进行预测。综上可见,上海浦东机场数据的IMF6序列和残差序列具有平稳性和复杂度相对较低的特点,采用传统的计量经济学模型进行预测(本文采用ARIMA模型),其余序列(IMF1、IMF2、IMF3、IMF4和IMF5)复杂度相对较高或者不具有平稳性,采用人工智能模型进行预测。同理,可以得到深圳宝安机场各子序列预测模型的选择结果。各序列选择的预测模型类型如表2所示。