《表1 网络支付交易记录可利用原始字段示例》
本文方法在两个不同数据集以及不同参数设定下,均可在数小时的时间内构造出模型训练所需的新特征.如表10和表11所示,对于第三方移动在线网络支付数据集,特征构造在约73万的样本数和285个原始特征的条件下进行,在不同参数下的平均特征构造时间为4.5h;对于银行B2C在线网络支付数据集,特征构造在约243万的样本数和6个原始特征的条件下进行,在不同参数下的平均特征构造时间为1.2h.相对于人工构造特征的数天甚至更长时间来说效率得到大幅提高.在同样是显性的自底而上的自动化特征工程方法中,LFE、RL方法都需要预训练的步骤,其需要大量的数据集准备工作,工作周期远大于本文方法.图14和图15显示了本工作方法与自底而上的普通特征构造树方法、自顶而下的Cognito方法和随机特征构造方法在特征构造时间上的对比,相对于自顶而下的Cognito方法,本文方法与普通特征构造树和随机特征构造方法耗时更少,而在后三者中本文方法构造的特征质量更高,模型性能更优.
图表编号 | XD00197666100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.01 |
作者 | 王成、王昌琪 |
绘制单位 | 同济大学电子与信息工程学院计算机科学与技术系、嵌入式系统与服务计算教育部重点实验室、同济大学上海智能科学与技术研究院、同济大学电子与信息工程学院计算机科学与技术系、嵌入式系统与服务计算教育部重点实验室 |
更多格式 | 高清、无水印(增值服务) |