《表6 数据均衡前后数据占比比较》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于团簇随机连接的CliqueNet航班延误预测模型》
本次训练使用的航班延误数据量较大,可达到百万级,各延误等级之间的数据样本数目差距很大,考虑到实验中的数据不均衡问题,在转换成输入矩阵时对样本进行重采样:通过上采样增加延误航班类别的数据条目,对正常航班采用下采样以减少样本数量,来适当地改变样本的分布。但是实际生活中的正常航班和延误航班数目差距很大,尤其是表3中重度延误情况,即使使用数据均衡,其数据占比仍然相差较大,但考虑其仍然符合实际的期望,故使用重采样后的数据集作为训练样本,具体信息如表6所示。训练使用的测试数据集在每种分类中按照1/10的比例随机挑选。
图表编号 | XD00197732900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.10 |
作者 | 屈景怡、曹磊、陈敏、董樑、曹烨琇 |
绘制单位 | 天津市智能信号与图像处理重点实验室(中国民航大学)、天津市智能信号与图像处理重点实验室(中国民航大学)、天津市智能信号与图像处理重点实验室(中国民航大学)、中国民用航空华东地区空中交通管理局、中国民用航空华东地区空中交通管理局 |
更多格式 | 高清、无水印(增值服务) |