《表4 数据区间的具体内容》
(1) 准备阶段。样本应按照财务有无异常划分为两类,其中财务无异常用Y1表示,财务异常用Y2表示,组成类别集合C={Y1,Y2}。本文共获取318个样本,其中包含158个测试样本和160个训练样本,还选择了65个特征变量组成待分类项X={X1,X2,X3,...,X65},数据量较大且具有连续性特征。在此情形下,需要对数据进行离散化处理,以提高分类器的有效性。离散化处理即是运用分割点将数据分割成多个区间,本文经测验得出,离散化成效最佳时分割点为五个,因此本文将数据划分为6个区间,数据区间的具体内容如表4所示:
图表编号 | XD0053179900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.20 |
作者 | 郑俊梅 |
绘制单位 | 河南工业贸易职业学院 |
更多格式 | 高清、无水印(增值服务) |