《表1 数据挖掘宽表变量:加油卡客户流失分析和预测——基于“跨行业数据挖掘标准流程”》

《表1 数据挖掘宽表变量:加油卡客户流失分析和预测——基于“跨行业数据挖掘标准流程”》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《加油卡客户流失分析和预测——基于“跨行业数据挖掘标准流程”》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

另外,从业务系统中取出的数据都是根据业务需要考虑设计的,并非专门针对数据挖掘设计。原始字段有时过于详细和分散,常常不能反映均值、占比、趋势、波动等衍生信息,直接用往往不能达到取得良好数据挖掘结果的目的,这时需要对数据进行各种变换,生成相关的衍生变量。为了更清晰地说明衍生变量的生成,一般把数据分为两类:一类是横截面数据,另一类是时间序列数据[13]。对横截面数据来说,本文用到了两种生成衍生变量的方法:强度相对指标和比例相对指标。对时间序列数据来说,本文用到了3种生成衍生变量的方法:汇总类指标、趋势类指标和波动类指标。数据准备的最终目的是形成宽表。通过对原始字段进行过滤、衍生、汇总和合并等操作,获得了表1所示内容的数据宽表,包含生成的衍生变量和选取的部分原始变量。