《表1 数据集中各变量的名称及含义》

《表1 数据集中各变量的名称及含义》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于XGBoost模型的银行信贷高风险客户识别研究——以我国Y银行为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文所使用的数据集来源于我国Y商业银行的信贷机构,共计20000笔客户的借款记录,经过数据预处理,剔除部分存在严重缺失的客户信息,剩余有效样本数据共计14073条,其中,发生违约的借款200笔,占比约为1.4%。本次样本数据集中共有21个变量,包括20个表示客户本身属性的变量和1个表示客户是否违约的结果变量,变量名如表1所示。同时,对部分变量进行衍生,变量“客户的主担保方式”包含抵押担保类型、保证担保类型、信用担保类型、质押担保类型共4种类型,采用One-hot方式生产4个哑变量。