《表1 实验数据集简述:基于簇内乘积量化的最近邻检索方法》
本节通过实验评估簇内乘积量化树的最近邻检索性能.实验采用的服务器平台搭载两个Intel(R)Xeon(R)E5-2620v4,8核2.10GHz处理器,32GB的内存,操作系统为Ubuntu 16.04,实现采用c++单线程模式,指令集为SSE2.用到的工具包有c++Eigen、Timer和标准容器库等.选取的公开测试数据集为ANN_SIFT10K、ANN_SIFT1M和ANN_GIST1M,数据集详细描述如表1所示.每个数据集均包括三个部分,分别为训练数据集合、基础数据集合和查询数据集合.其中查询数据集合附着谜底文件(groundtruth file),标识数据集合中每个向量的前K个真实最近邻向量,对于上述三个数据集,K值为100.训练数据集合是用于训练簇内乘积量化树的索引结构,即簇内乘积量化树的各层质心;基础数据集合用于构建索引表和数据库,完成数据插入和预计算必要的重排信息;查询数据集合借助谜底文件做近邻检索结果的比对,将查询返回的结果向量与谜底文件比对统计查询准确率.
图表编号 | XD00134457800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 刘淑伟、陈威、赵伟、陈进才、卢萍 |
绘制单位 | 华中科技大学武汉光电国家研究中心、华中科技大学信息存储系统教育部重点实验室、华中科技大学武汉光电国家研究中心、华中科技大学信息存储系统教育部重点实验室、华中科技大学计算机科学与技术学院、华中科技大学武汉光电国家研究中心、华中科技大学信息存储系统教育部重点实验室、华中科技大学信息存储系统教育部重点实验室、华中科技大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |