《表1:评价指标明细:基于集成学习的上市企业违约风险评价》
前面的两个阶段是对数值型特征的筛选,在实际商业场景中,企业所在的不同行业的违约情况往往也不尽相同。故这里引入了“行业名称”这一分类变量作为评价指标。值得注意的是,行业一共有18个类别,类别数较多。如果对其进行OneHot编码,会造成空间的稀疏性。而Light GBM模型和Cat Boost模型直接支持类别变量,因此,“行业名称”这一分类变量只在这两个模型中进行训练。最终,本文确定出21个评价指标,如表1所示。
图表编号 | XD00211378300 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.20 |
作者 | 范诗语、耿子悦、田芮绮、杜永强 |
绘制单位 | 天津商业大学、天津商业大学、天津商业大学、天津商业大学 |
更多格式 | 高清、无水印(增值服务) |