《表2 抽样比例与样本量》
信赖过度风险经常会导致严重的审计后果,因而审计人员更为关注对舞弊公司的正确分类。研究表明,对于一些基分类器而言,均衡的数据集可以更有效地提高全局的分类性能。由于舞弊数据(714个)仅占有效样本总数(4461个)的16%,相对于非舞弊数据(3747个)过于稀少,因此本研究分别采取1∶1配对样本及1∶2、1∶3、1∶4三种过度抽样比例进行研究,选择70%的数据作为训练样本,另外30%为测试样本,样本规模如表2所示。
图表编号 | XD009917500 严禁用于非法目的 |
---|---|
绘制时间 | 2018.03.23 |
作者 | 张莉 |
绘制单位 | 北京信息科技大学信息管理学院 |
更多格式 | 高清、无水印(增值服务) |