《表1 3种算法的数据分割点数、压缩比、拟合均方误差对比结果》

《表1 3种算法的数据分割点数、压缩比、拟合均方误差对比结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向大规模数据的特征趋势推理算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

拟合均方误差主要用于判定算法推理结果的误差均值,可分析数据特征趋势的变化水平,实验在具有差异性的分割点检测阈值下,对比上述3种算法的分割点点数、压缩比和拟合均方误差,对比结果列于表1.由表1可见:在相同阈值的前提下,本文算法的最大分割点点数为212个,分别比随机变分推理算法和并行化Top-k Skyline查询算法的最大分割点点数高3和7,且本文算法的分割点点数始终大于其他两种算法,说明本文算法在推理大规模数据的特征趋势时,能全面分割大规模数据特征,确保了大规模数据特征趋势推理结果的准确度;压缩比数是数据流的数据量与分割总数间的比值,表示实验所用大规模数据与分割总数成正比,压缩比越小说明大规模数据特征分割的越全面,本文算法、并行化Top-k Skyline查询算法以及随机变分推理算法的最大压缩比排序为39.33<41.51<42.31,且本文算法的压缩比始终小于另外两种算法,说明本文算法分割的大规模数据特征更全面,同样为大规模数据特征的准确推理提供了可靠依据;从拟合均方误差方面分析,本文算法的拟合均方误差最大值为5.24,随机变分推理算法的拟合均方误差最大值为11.02,并行化Top-kSkyline查询算法的拟合均方误差最大值为11.34,本文算法的拟合均方误差最小,说明本文算法平均误差最小,分割大规模数据特征的准确率最高[15].