《表3 顺序KNN和本文方法所得到的结果》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《Spark框架结合分布式KNN分类器的网络大数据分类处理方法》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

本节将本文方法与顺序版本KNN方法进行比较，其是基于Hadoop MapReduce框架。为此，本文使用NUS-WIDE-bow和Higgs数据集。NUS-WIDE-bow和Higgs数据集是计算机视觉领域常用的数据集。在这些数据集中，本文方法只需要进行一次迭代，因为测试数据集适合每个映射的内存，并且reducer的数量也被固定为1。首先，本文在这些数据集上运行KNN的顺序版本作为基准。这个顺序版本逐行读取测试集，作为避免存储器问题的直接解决方案。表2显示了由标准顺序KNN算法随着邻居数量的不同所获得的运行时间（以s为单位）和平均精度的结果（其中map数量设置为32）。表3总结了k=1时两种方法获得的结果（其中邻居数量设置为1）。它显示了不同map数量的平均总时间和相对于顺序版本实现的加速。如前所述，这两种方法都对应于KNN的精确实现。

图表编号	XD00107239800 严禁用于非法目的
绘制时间	2019.11.01
作者	曹瑜、王楠、徐志超
绘制单位	哈尔滨金融学院计算机系、吉林财经大学管信学院、吉林大学计算机学院、吉林财经大学管信学院
更多格式	高清、无水印（增值服务）