《表4:模型中属性的使用率》

《表4:模型中属性的使用率》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于C5.0决策树算法的开放数据的效用预测研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

输出的模型在测试集的预测准确度为86.2%,在输出的模型中属性的使用率排序如表4所示。通过分析属性使用率可知在预测数据开放效用时上述的五个数据属性指标均有一定的参考意义。其中数据的上线月数是一重要指标,表明数据上线的时间长度对数据效用状态的预测十分关键,从输出的决策树中可以发现A类数据主要集中在上线月数大于13个月的数据部分,说明数据的关注度和使用率达到较好水平需要一定的时间,短期内上线的数据可能由于数据本身完备性和曝光度等问题没有得到用户的关注和使用。数据的提供方对于数据的效用预测也很重要,其中整体来看教育局、民政局、农委、统计局提供的数据效用较好,科技局、人社局、档案局、文广局、质监局提供数据的效用还需改善。此外下载格式较丰富的数据受到的关注度较高。所属领域为交通运输、文体休闲、社会发展、经济建设、公共安全的数据受到的关注度较高。数据更新频率高于每年更新的数据整体效用更好。