《表1 0 尺度下推:不同算法的运行时间比较》
s
运行时间是评价算法好坏的重要指标。不同算法运行时间的比较结果如表10所示。从表10可以看出,DSAL算法在所有测试数据集上均快于其他对比算法,运行时间平均提高了11.42 min。其中,由文献[12]可知,算法CMS的时间复杂度很高,其中求两个对象之间相似性的时间复杂度为O(nm3R2),m表示属性个数,n表示对象个数,R表示不同属性值个数。将CMS方法应用到基准尺度,对原始数据集分块执行CMS方法,相当于减少了算法运行的对象个数,有时也可以减少不同属性值个数,从而减少运行时间。由表10还可知,DSAL算法的运行速度明显比原始的CMS方法快很多,CSM方法在多尺度数据挖掘中的应用也是对该方法的一种优化。其他对比算法的运行时间整体上随数据量的增大而逐渐增加,但DSAL算法的运行时间与数据集大小没有明显关系。因为DSAL算法与UACMS算法一样,运行时间与基准尺度的聚类数目和基准尺度的划分块数有关系,并不受原始数据集大小的影响。由于算法的运行时间受多种因素影响,比如运行算法的机器配置,代码优化程度等,因此本文中的运行时间仅为本实验环境下的运行时间,仅供参考。
图表编号 | XD00170140300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 田真真、赵书良、李文斌、张璐璐、陈润资 |
绘制单位 | 河北师范大学计算机与网络空间安全学院、河北师范大学河北省供应链大数据分析与数据安全工程研究中心、河北师范大学河北省网络与信息安全重点实验室、河北师范大学计算机与网络空间安全学院、河北师范大学河北省供应链大数据分析与数据安全工程研究中心、河北师范大学河北省网络与信息安全重点实验室、河北地质大学信息工程学院、河北师范大学计算机与网络空间安全学院、河北师范大学河北省供应链大数据分析与数据安全工程研究中心、河北师范大学河北省网络与信息安全重点实验室、河北师范大学数学科学学院 |
更多格式 | 高清、无水印(增值服务) |