《表2 不同特征组合在数据集1上的结果》
注:BTMS:Bilingual Topic Model Similarity;SES:Summary Embedding Similarity;TES:Title Embedding Similarity;ATES:Anchor Text Embedding Similarity;COI:Co-occurrence Information
为了验证特征的有效性,使用linear ranking svm[24]学习特征权重,并且在数据集1上使用序列前向选择方法对不同的特征组合进行测试,从而选择最佳特征组合。实验中采用信息检索特征作为基础特征,在基础特征之上不断增加其他特征,直到所有特征都被选择。以Mean Reciprocal Ratio(MRR)和Accuracy作为数据集1的评价指标,每次选择评价指标最高的特征和前面的特征进行组合,实验结果如表2所列。
图表编号 | XD0035520200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.15 |
作者 | 余圆圆、巢文涵、何跃鹰、李舟军 |
绘制单位 | 北京航空航天大学计算机学院、北京航空航天大学计算机学院、国家计算机网络应急技术处理协调中心、北京航空航天大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |