《表7 词嵌入投影模型在中文数据集上的综合评测(单位:%)》

《表7 词嵌入投影模型在中文数据集上的综合评测(单位:%)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向上下位关系预测的词嵌入投影模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

我们在两个公开的中文数据集BK和FD上评测了词嵌入投影模型的预测精度.在这组实验中,我们采用文献[11]的实验设置,将这两个数据集随机分成5等份,分别作为测试集进行5折交叉验证,最后将实验预测结果平均,用Precision、Recall和F1作为评测指标.我们首先利用两个概念词向量的拼接、相减和相加作为特征训练关系预测分类器.他们也在文献[13,45-46]等中作为强基线方法.这些方法在表5中分别记为Concat、Offset和Addition,我们也采用Li等人[24]提出的中文上下位关系预测算法作为基线方法.对于本文提出的算法,IPM的参数设置为t=5,每次选出Top-50个元组作为候选增量数据,加入数据集.在TPM中,我们设置μ1=μ2=10-4,实验细节和参数调整参见文献[11].我们同样调整模型PPM、IPM、JTPM和MWPM中参数K的值,实验结果参见图8.因为中文分类体系的规模一般不大,不适合运用于ALPM的模型,所以这个模型退化为NPM,下文不再讨论.其余模型与中文的语言特性无关,所以我们采取与英语实验相同的设置.实验结果见表7.