《表1 实验数据集简述:基于簇内乘积量化的最近邻检索方法》

《表1 实验数据集简述:基于簇内乘积量化的最近邻检索方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于簇内乘积量化的最近邻检索方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本节通过实验评估簇内乘积量化树的最近邻检索性能.实验采用的服务器平台搭载两个Intel(R)Xeon(R)E5-2620v4,8核2.10GHz处理器,32GB的内存,操作系统为Ubuntu 16.04,实现采用c++单线程模式,指令集为SSE2.用到的工具包有c++Eigen、Timer和标准容器库等.选取的公开测试数据集为ANN_SIFT10K、ANN_SIFT1M和ANN_GIST1M,数据集详细描述如表1所示.每个数据集均包括三个部分,分别为训练数据集合、基础数据集合和查询数据集合.其中查询数据集合附着谜底文件(groundtruth file),标识数据集合中每个向量的前K个真实最近邻向量,对于上述三个数据集,K值为100.训练数据集合是用于训练簇内乘积量化树的索引结构,即簇内乘积量化树的各层质心;基础数据集合用于构建索引表和数据库,完成数据插入和预计算必要的重排信息;查询数据集合借助谜底文件做近邻检索结果的比对,将查询返回的结果向量与谜底文件比对统计查询准确率.