《表2 与其他算法比较结果》
为了证明所提算法确实有效,将利用同样的文本数据信息与其他的算法进行实验效果比对,分别在本文所提框架中主题建模部分改为TF-IDF、利用BP算法估计LDA模型隐藏参数和利用Gibbs算法推断LDA模型隐藏参数这三种算法进行对比实验,实验结果如表2所示。由表2可以看出,对于相同的文本数据并且实验参数设置相同的情况下,各算法实体对齐的效果不同,并有较大差异。首先,就本文算法来说,其效果虽然和预想的结果差异较大,但是算法的准确率确实是高于LDA+BP的,由此可以证明本文算法对于BP算法的改进确实是有效的。其次,TF-IDF的准确率较本文算法略低,大概率是因为TF-IDF仅仅是考虑了词项的词频信息而没有考虑文档的潜在语义。再次,由实验结果来看,LDA+Gibbs[23]的各项指标均与本文算法的结果大致相同,这为本文算法的再次优化提供了新的研究方向。最后,由实验数据可以看出,本文算法的各项性能指标相对于原始算法有较大的提高,本文算法对于解决百科知识库实体对齐的问题有较好的效果。
图表编号 | XD00107241800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 刘振鹏、贺梦洁、张彬、董静、徐建民 |
绘制单位 | 河北大学电子信息工程学院、河北大学信息技术中心、河北大学电子信息工程学院、河北大学信息技术中心、河北大学电子信息工程学院、河北大学网络空间安全与计算机学院 |
更多格式 | 高清、无水印(增值服务) |