《表6 数据均衡前后数据占比比较》

《表6 数据均衡前后数据占比比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于团簇随机连接的CliqueNet航班延误预测模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本次训练使用的航班延误数据量较大,可达到百万级,各延误等级之间的数据样本数目差距很大,考虑到实验中的数据不均衡问题,在转换成输入矩阵时对样本进行重采样:通过上采样增加延误航班类别的数据条目,对正常航班采用下采样以减少样本数量,来适当地改变样本的分布。但是实际生活中的正常航班和延误航班数目差距很大,尤其是表3中重度延误情况,即使使用数据均衡,其数据占比仍然相差较大,但考虑其仍然符合实际的期望,故使用重采样后的数据集作为训练样本,具体信息如表6所示。训练使用的测试数据集在每种分类中按照1/10的比例随机挑选。