《表3 SSA算法在LTSAF、SparkR和RStduio上的计算时间》
SSA算法进一步分为两类.NUTRLAN方法仅计算部分奇异值,其计算精度低但计算效率高.SVD方法计算全部奇异值,其计算精度高但计算效率低[31].LTSAF和SparkR均采用SVD算法测试计算耗时,其结果如表3所示.在数据集规模为8MB,RStudio已无法在24h内计算出有效结果.虽然NU-TRLAN算法效率略高,但同样无法处理32MB以上的数据集.基于分布式的LTSAF和SparkR有较好的运算能力,在数据集大小为1024MB时,8节点的SparkR需要11 744s完成分析运算,而LTSAF耗时仅5406s.LTSAF分解的近似解分别与RStudio的精确解相比,三个分量的相似度均在99.99%以上.
图表编号 | XD00163174600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.01 |
作者 | 滕飞、黄齐川、李天瑞、王晨、田春华 |
绘制单位 | 西南交通大学信息科学与技术学院、中铁一院轨道交通工程信息化国家重点实验室、西南交通大学信息科学与技术学院、西南交通大学信息科学与技术学院、清华大学大数据系统软件国家工程实验室、清华大学大数据系统软件国家工程实验室 |
更多格式 | 高清、无水印(增值服务) |