《表2 样本数据离散化处理之后的情况》

《表2 样本数据离散化处理之后的情况》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于大数据算法的企业研发投资影响因素分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由以上算法介绍得知,关联规则所分析的对象为数据项集的元素,而样本数据中诸多变量为数值变量,即连续变量。所以必须对样本数据进行离散化预处理,从而将其转化为可供分析的项集。运用经离散化处理的数据可使后期模型分析结果更加稳定,使自变量和目标变量之间的关系变得更加清晰。在此将数据变量统一按照数值大小划分为5个区间(不包括小于等于0的数值统一划分为“<=0”的元素),如表2所示。