《表1 算法运行时间对比/s》
![《表1 算法运行时间对比/s》](http://bookimg.mtoou.info/tubiao/gif/SJSJ201906017_09700.gif)
本系列图表出处文件名:随高清版一同展现
《Spark框架下分布式K-means算法优化方法》
实验采用4×107个数据样本对算法的扩展性进行测试。图6展示了传统K-means、T-Kmeans和S-Kmeans算法的并行化时间对比,可以看出S-Kmeans算法有更高效的聚类速度,运行时间随执行器节点的增加逐步减少。同时由于Spark集群自身的时间开销,算法的运行时间没能随着节点的增加达到线性降低。图7展示了算法的加速比对比。S-Kmeans算法可扩展性良好,随着集群规模的扩大,算法的加速比与T-Kmeans算法基本保持一致。
图表编号 | XD0074388700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.16 |
作者 | 王法玉、刘志强 |
绘制单位 | 天津理工大学智能计算及软件新技术天津市重点实验室、天津理工大学智能计算及软件新技术天津市重点实验室 |
更多格式 | 高清、无水印(增值服务) |