《表3 三清山寻路行为多维决策CHAID分析结果》

《表3 三清山寻路行为多维决策CHAID分析结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于决策树的山岳景区游客路径影响因素研究——以世界遗产地三清山为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

以聚类后的游客路径类型为因变量,以游客个体人口统计特性和旅行特征等共计11个变量为自变量,采用决策树模型的CHAID生长方法对游客路径选择进行分析(表3)。该模型中,由于“游客路径类型”是6分值变量,生成规则较为零散,每条规则对应的样本量有限,预测准确率为54.4%,因在K-means聚类过程中信息被覆盖,再进行决策树预测时存在二次偏差较多。其中,路径6准确率为69.8%,因为其路径中原始路径A→D→J→I→G→E→D→A较多(N=82)。本研究采用Boosting方法提高模型准确率,经过迭代10次规则模型模拟,样本精度提升至70.9%。变量预测重要性(importance)由大到小依次为旅游方式(0.415)、停留时间(0.168)、主要交通方式(0.129)、职业(0.063)、月收入(0.060)和来源省份(0.050)等。从生成的规则中提取出置信度超过60%的4个规则(对应变量赋值见表1)。(1)规则1:如果旅游方式=4且月收入≤2,则预测值(prediction,pre)=2,概率(probability,pro)=0.818(游客数N=10);(2)规则2:如果旅游方式=1且来源省份=1,则pre=6,pro=0.686(游客数N=17);(3)规则3:如果旅游方式=1且来源省份=0及停留时间>2,则pre=5,pro=0.678(游客数N=11);(4)规则4:如果旅游方式=1且来源省份=0及停留时间≤2,则pre=6,pro=0.655(游客数N=30)。