《表1 λ取值不同时在两个数据集上的MAP值》

《表1 λ取值不同时在两个数据集上的MAP值》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于PCA的哈希图像检索算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验分别在两个数据集上进行,每个数据集随机取1000个样本作为测试数据集,剩余的样本作为训练数据集。为了保证实验效果的公平和准确,我们在每种方法上循环10次以获取最终的实验结果。并以图表的形式展现。表1展现的是λ设置不同值时,在CIFAR-10数据集和CALTECH256数据集上MAP值。值得说明的是λ=0时对应为SBQ,λ=1时对应DBQ。从实验的结果可以看到λ=0.75时,在两个数据集上的检索效果基本上都是最好的,如在CALTECH256数据集上,相比SBQ其MAP值平均提高了12%,比DBQ提高了6%,这是因为此时不但很好地减少了量化误差,也尽可能多地保留了投影信息,这也可以说明量化阶段对于编码性能的重要性。其中CALTECH256上的MAP值在整体上要高于CIFRA-10,是因为样本特征提取方法不同的缘故,本文研究的重点不在于此,故不做赘述,但这并不影响对实验效果的分析与比较。图2和图3对应了不同哈希算法两个数据集上的PR曲线,我们提出的PCA-ABQ在不同位数上的编码效果均要优于现有流行的哈希算法。可以看到,PCA-SBQ方法在整体上的编码效果是比较差的,因为量化所带来的误差太大,虽然保留了较多的投影信息,但是量化的误差也较大,PCA-DBQ的检索效果整体上则要优于PCA-SBQ,因为减小了量化带来的误差,而PCA-ABQ充分利用了基于PCA哈希的特性,在减少量化误差,与保留投影信息之间寻找到一个平衡点,取得了最好的检索效果。相较于随机投影的哈希算法,PCA-ABQ无论是在低位和高位编码上都能取得较好的检索效果,而基于随机投影的算法,在低位编码上的性能是比较差的,因为其哈希函数的碰撞几率比较大,只有在编码位数比较高的情况下,才能达到较好的检索效果。