《表1 0 决策树自变量重要性》

《表1 0 决策树自变量重要性》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于数据挖掘技术的非税收入审计研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

(1)电子数据预处理。由于审计人员采集的数据信息直接来源于非税征管单位、财政以及银行等不同部门,这些数据在格式上存在较大差别,而数据挖掘技术所需数据必须是结构好、内容清洁的,所以不能将这些数据直接应用于数据审计,需要对其进行数据预处理。SAS分析软件具有构建可视化数据流程图的功能,使用者只需在系统中根据次序增加能够达到所需不同功能的节点,再通过某些程序对这些节点的参数进行设置,便可以构建出所需要的数据挖掘流程图。该流程图构建出之后直接运行,就能得到想要的数据挖掘结果。审计人员利用该软件,从非税相关部门抽取所需的非税收入征管数据库,通过该软件对这些数据格式、编码等进行预处理,并对重复数据进行删除、对缺失数据给予补充,最终形成非税收入收缴情况表。具体内容如表1所示。另外,审计人员对巩义市涉及的收费主管人员、各乡镇经济总量以及河网分布情况进行了汇总,汇总结果如表2所示。