《表1 数据集中各变量的名称及含义》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于XGBoost模型的银行信贷高风险客户识别研究——以我国Y银行为例》
本文所使用的数据集来源于我国Y商业银行的信贷机构,共计20000笔客户的借款记录,经过数据预处理,剔除部分存在严重缺失的客户信息,剩余有效样本数据共计14073条,其中,发生违约的借款200笔,占比约为1.4%。本次样本数据集中共有21个变量,包括20个表示客户本身属性的变量和1个表示客户是否违约的结果变量,变量名如表1所示。同时,对部分变量进行衍生,变量“客户的主担保方式”包含抵押担保类型、保证担保类型、信用担保类型、质押担保类型共4种类型,采用One-hot方式生产4个哑变量。
图表编号 | XD00162955000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.20 |
作者 | 顾洲一 |
绘制单位 | 浙江金融职业学院 |
更多格式 | 高清、无水印(增值服务) |