《表2 基于管道A随机抽样和分层抽样的平均绝对百分误差》

《表2 基于管道A随机抽样和分层抽样的平均绝对百分误差》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于机器学习的原油管输能耗预测方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

训练集和测试集按4:1的比例进行划分。由于传统的随机抽样方法可能会导致测试集的分布规律与原始数据集分布规律有较大偏差,使预测结果不客观。因此,考虑采用分层抽样方法来划分数据集[39-40]。在原油运输过程中,输量对电耗影响最大,根据输量的分布规律可知,某些特定范围内的数据量较少,采用抽样时可能会遗漏该范围内的数据,为了保证每一数据范围内的数据都能够按比例被抽取,因此,依据数据的分布规律,将采集的数据划分为4个区间。以管道A为例,两种抽样方法得到的测试集与初始样本的偏差如表2所示。3条管线的随机抽样和分层抽样的平均绝对百分比误差(MAPE)见图6。对于A、B、C管道,随机抽样的MAPE分别为26.44%、19.20%、17.46%,分层抽样的MAPE分别为2.16%、2.16%、1.05%。结果表明,分层抽样得到的测试集与初始样本有较好的一致性。因此,本文采用分层抽样来划分训练集和测试集。