《表3 顺序KNN和本文方法所得到的结果》

《表3 顺序KNN和本文方法所得到的结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《Spark框架结合分布式KNN分类器的网络大数据分类处理方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本节将本文方法与顺序版本KNN方法进行比较,其是基于Hadoop MapReduce框架。为此,本文使用NUS-WIDE-bow和Higgs数据集。NUS-WIDE-bow和Higgs数据集是计算机视觉领域常用的数据集。在这些数据集中,本文方法只需要进行一次迭代,因为测试数据集适合每个映射的内存,并且reducer的数量也被固定为1。首先,本文在这些数据集上运行KNN的顺序版本作为基准。这个顺序版本逐行读取测试集,作为避免存储器问题的直接解决方案。表2显示了由标准顺序KNN算法随着邻居数量的不同所获得的运行时间(以s为单位)和平均精度的结果(其中map数量设置为32)。表3总结了k=1时两种方法获得的结果(其中邻居数量设置为1)。它显示了不同map数量的平均总时间和相对于顺序版本实现的加速。如前所述,这两种方法都对应于KNN的精确实现。