《表3 三清山寻路行为多维决策CHAID分析结果》
本系列图表出处文件名:随高清版一同展现
《基于决策树的山岳景区游客路径影响因素研究——以世界遗产地三清山为例》
以聚类后的游客路径类型为因变量,以游客个体人口统计特性和旅行特征等共计11个变量为自变量,采用决策树模型的CHAID生长方法对游客路径选择进行分析(表3)。该模型中,由于“游客路径类型”是6分值变量,生成规则较为零散,每条规则对应的样本量有限,预测准确率为54.4%,因在K-means聚类过程中信息被覆盖,再进行决策树预测时存在二次偏差较多。其中,路径6准确率为69.8%,因为其路径中原始路径A→D→J→I→G→E→D→A较多(N=82)。本研究采用Boosting方法提高模型准确率,经过迭代10次规则模型模拟,样本精度提升至70.9%。变量预测重要性(importance)由大到小依次为旅游方式(0.415)、停留时间(0.168)、主要交通方式(0.129)、职业(0.063)、月收入(0.060)和来源省份(0.050)等。从生成的规则中提取出置信度超过60%的4个规则(对应变量赋值见表1)。(1)规则1:如果旅游方式=4且月收入≤2,则预测值(prediction,pre)=2,概率(probability,pro)=0.818(游客数N=10);(2)规则2:如果旅游方式=1且来源省份=1,则pre=6,pro=0.686(游客数N=17);(3)规则3:如果旅游方式=1且来源省份=0及停留时间>2,则pre=5,pro=0.678(游客数N=11);(4)规则4:如果旅游方式=1且来源省份=0及停留时间≤2,则pre=6,pro=0.655(游客数N=30)。
图表编号 | XD0057259900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.10 |
作者 | 刘培学、张建新、吴荣华、刘泽华 |
绘制单位 | 南京大学地理与海洋科学学院、南京大学地理与海洋科学学院、广州市城市规划勘测设计研究院、南京财经大学工商管理学院 |
更多格式 | 高清、无水印(增值服务) |