《表2 特征选择结果:加油卡客户流失分析和预测——基于“跨行业数据挖掘标准流程”》

《表2 特征选择结果:加油卡客户流失分析和预测——基于“跨行业数据挖掘标准流程”》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《加油卡客户流失分析和预测——基于“跨行业数据挖掘标准流程”》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了迅速筛选出对于是否流失有重要影响的字段,使用了特征选择建模节点。数据挖掘问题可能包括成百甚至上千个可用作输入的备选字段。为了缩小选择范围,可以使用特征选择算法来识别对某给定分析最为重要的字段。特征选择由以下3个步骤组成:1)筛选。删除不重要或有问题的输入、记录或个案(例如输入字段含有过多缺失值,或者输入字段的变异太大或太少而变得无用)。2)秩。对剩余输入进行排序并根据重要性进行分级。3)选择。识别在后续模型中使用的功能子集,例如通过仅保留最重要的输入,过滤或排除所有其他输入。本文根据Pearson卡方对自变量进行了重要性排序,0.95以上为重要,0.9以上为一般重要,0.9以下为不重要。27个变量对于“流失”均有较大影响,其中“性别”和“月均金额”为“一般重要”,其他均为“重要”(见表2)。