《表2 数据集划分:基于知识图谱的小微企业贷款申请反欺诈方案》
实验将所有存在申请贷款行为的140 885家企业样本作为总数据集,整体数据集按照4:1的比例划分为训练集和测试集,训练集用于模型训练,测试集用于模型验证。其中,正样本(欺诈用户)共计389个,负样本(正常用户)共计140 496个。正负样本比例约2.7‰,数据集存在不平衡现象。划分后的数据集中,正负样本的比例在训练集与测试集中保持一致,整体样本分布见表2。
图表编号 | XD0056673400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.15 |
作者 | 金磐石、万光明、沈丽忠 |
绘制单位 | 中国建设银行股份有限公司、中国建设银行金融科技部、建信金融科技有限责任公司厦门事业群 |
更多格式 | 高清、无水印(增值服务) |