《表1 模拟数据的OD流向之间的相似性数值》
为了更好地理解和分析该逐级合并策略,利用模拟数据作为示例进行介绍。模拟数据中有6条OD流向,该6个OD流向之间的相似性数值如表1所示,在OD流合并过程开始前,将每条流向看作一个初始类簇。图6(a)是待合并的模拟流向数据;图6(b)是在不设置合并等级时可能会出现的合并顺序和合并结果,因为合并的顺序是随机产生,导致最后的聚类结果可能比较差;图6(c)是以经典的自底向上的层次聚类方法进行类簇合并的顺序和合并结果,合并依据最优的合并顺序进行,每次迭代只合并一个类簇组合;图6(d)是将高相似度参数设为0.7和0.5共2个等级,利用逐级合并的层次聚类进行类簇合并的顺序和合并结果,每次迭代合并处于同一合并等级内的多个合并组合。将图6(c)和图6(d)相比较,发现得到聚类的结果虽然一致,但经典的自底向上的层次聚类方法的合并顺序更准确,同时迭代的次数也更多,考虑到每次迭代需要计算所有类簇两两之间的高相似度,当OD流向数据量较大的情形下聚类时间也更长。
图表编号 | XD00150396100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.25 |
作者 | 项秋亮、邬群勇、张良盼 |
绘制单位 | 数字中国研究院(福建)、福州大学卫星空间信息技术国家地方联合工程研究中心、空间数据挖掘与信息共享教育部实验室、数字中国研究院(福建)、福州大学卫星空间信息技术国家地方联合工程研究中心、空间数据挖掘与信息共享教育部实验室、数字中国研究院(福建)、福州大学卫星空间信息技术国家地方联合工程研究中心、空间数据挖掘与信息共享教育部实验室 |
更多格式 | 高清、无水印(增值服务) |