《表2 top-k (2~10) 检索结果的MAP (%) 、DCG、RBP85 (%) 、ERR (%) 值Table 2 MAP (%) , DCG, RBP85 (%) , and ERR (%
WCSE,Wikipedia Chemical Structure Explorer;MAP,mean average precision;DCG,discounted cumulative gain;RBP,rank-biased precision;ERR,expected reciprocal rank.
WCSE是目前在已公开完整数据集的化学分子结构式检索系统中检索效果最好的,其所用WIKI数据集可用于对比实验。本文系统与WCSE的对比结果如表2所示,其中,mean average precision(MAP)、discounted cumulative gain(DCG)、rankbiased precision(RBP)和expected reciprocal rank(ERR)是衡量检索准确性的指标,RBP指标的参数p设定为0.85,设定检索结果范围为前2~10个,即表2中top-2到top-10。结果显示,本文系统在各项指标度量均比WCSE表现更好,例如,针对top-10,上述指标的领先幅度分别为10%、1.41、6.42%、1.32%。具体而言,MAP指标表明本文系统比WCSE能检索到更多的相似结构式;更高的DCG数值则说明其对结果中的相似结构式排序效果更好。此外,本文系统在RBP85和ERR指标的更好表现,则进一步说明其返回的相似结构式结果相比WCSE更符合用户的查询意图。观察表2中各项指标随top-k变化的趋势,可以发现两者在MAP指标上的表现均逐渐走低,表明两个系统均倾向于将更相似的结构式优先返回。两者ERR数值趋于稳定,说明两个系统均能返回满意度较高的结果。但对于DCG和RBP85两个指标,两系统的差距均逐渐加大,这表明本文系统在更大范围的检索上表现更优。综上所述,本文方法不仅能检索到更多相似的分子结构式,而且检索结果有更好的排序效果,即优先返回更相似的分子结构式。
图表编号 | XD005725400 严禁用于非法目的 |
---|---|
绘制时间 | 2018.04.18 |
作者 | 瞿经纬、吕肖庆、刘振明、廖媛、孙鹏晖、王蓓、汤帜 |
绘制单位 | 北京大学计算机科学技术研究所、北京大学计算机科学技术研究所、数字出版技术国家重点实验室、北京大学药学院药物化学系、北京大学计算机科学技术研究所、北京大学计算机科学技术研究所、北京大学计算机科学技术研究所、北京大学计算机科学技术研究所、数字出版技术国家重点实验室 |
更多格式 | 高清、无水印(增值服务) |