《表1 算法运行时间对比/s》

《表1 算法运行时间对比/s》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《Spark框架下分布式K-means算法优化方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验采用4×107个数据样本对算法的扩展性进行测试。图6展示了传统K-means、T-Kmeans和S-Kmeans算法的并行化时间对比,可以看出S-Kmeans算法有更高效的聚类速度,运行时间随执行器节点的增加逐步减少。同时由于Spark集群自身的时间开销,算法的运行时间没能随着节点的增加达到线性降低。图7展示了算法的加速比对比。S-Kmeans算法可扩展性良好,随着集群规模的扩大,算法的加速比与T-Kmeans算法基本保持一致。