《表2 基于管道A随机抽样和分层抽样的平均绝对百分误差》
训练集和测试集按4:1的比例进行划分。由于传统的随机抽样方法可能会导致测试集的分布规律与原始数据集分布规律有较大偏差,使预测结果不客观。因此,考虑采用分层抽样方法来划分数据集[39-40]。在原油运输过程中,输量对电耗影响最大,根据输量的分布规律可知,某些特定范围内的数据量较少,采用抽样时可能会遗漏该范围内的数据,为了保证每一数据范围内的数据都能够按比例被抽取,因此,依据数据的分布规律,将采集的数据划分为4个区间。以管道A为例,两种抽样方法得到的测试集与初始样本的偏差如表2所示。3条管线的随机抽样和分层抽样的平均绝对百分比误差(MAPE)见图6。对于A、B、C管道,随机抽样的MAPE分别为26.44%、19.20%、17.46%,分层抽样的MAPE分别为2.16%、2.16%、1.05%。结果表明,分层抽样得到的测试集与初始样本有较好的一致性。因此,本文采用分层抽样来划分训练集和测试集。
图表编号 | XD00208810500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.01 |
作者 | 徐磊、侯磊、李雨、张鑫儒、白小众、雷婷、朱振宇、刘金海、谷文渊、孙欣 |
绘制单位 | 中国石油大学(北京)机械与储运工程学院、中国石油大学(北京)油气管道输送安全国家工程实验室、石油工程教育部重点实验室、中国石油大学(北京)机械与储运工程学院、中国石油大学(北京)油气管道输送安全国家工程实验室、石油工程教育部重点实验室、中国石油大学(北京)机械与储运工程学院、中国石油大学(北京)油气管道输送安全国家工程实验室、石油工程教育部重点实验室、中国石油大学(北京)机械与储运工程学院、中国石油大学(北京)油气管道输送安全国家工程实验室、石油工程教育部重点实验室、国家管网集团北方管道有限责任公司锦州输 |
更多格式 | 高清、无水印(增值服务) |