《表1 10折交叉验证最优结果与平均结果》
通过上述步骤,得到252 325×1 878维特征矩阵,其中,正负样本比例约为1∶9,按7∶3划分为训练集与测试集。考虑到样本的不均衡性与实际业务需求,准确率不能客观衡量分类算法的优劣,因此选用F1分值进行结果评估。使用十折交叉验证法训练LightGBM分类器,最优结果与平均结果见表1。平均ROC曲线如图5所示,其中“…”代表随机分类情况。多次试验发现,提高负样本权重能够有效提升F1分值。
图表编号 | XD0050587700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.20 |
作者 | 朱琳、赵娟、王伊婷、冯俊兰、邓超 |
绘制单位 | 中国移动通信有限公司研究院、中国移动通信有限公司研究院、中国移动通信有限公司研究院、中国移动通信有限公司研究院、中国移动通信有限公司研究院 |
更多格式 | 高清、无水印(增值服务) |