《表3 链路预测相似性指标定义》

《表3 链路预测相似性指标定义》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于LDA主题模型与链路预测的新兴主题关联机会发现研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为获得更好的新兴主题关联预测效果,本文采用多种不同的相似性指标分析深度学习领域主题共现网络,将现有数据划分为训练集与测试集,计算训练集中尚未产生连接的主题节点在未来产生链接可能性的预测精度,比较20项不同指标(其中主要包括基于共同邻居、路径、随机游走的三大类相似性。第一大类,基于局部信息的相似性指标有:共同邻居指标 (Common Neighbors,CN)、余弦相似性指标(Salton)、Jaccard指标、Sorenson指标、大度节点有利指标(Hub Promoted Index,HPI)、大度节点不利指标(Hub Depressed Index,HDI)、LHN指标、优先链接指标(Preferential Attachment,PA)、Adamic-Adar指标(AA)、Resource-Allocation指标(RA)、TSCN指标、LNBCN指标、LNBAA指标、LNBRA指标;第二大类,基于路径的相似性指标有:局部路径指标(Local Path,LP)、Katz指标;第三大类,基于随机游走的相似性指标有:平均通勤时间指标(Average Commute Time,ACT)、基于随机游走的余弦相似性指标(Cos+)、Sim Rank指标(Sim R),以及其他一些相似性指标MFI。各指标定义如表3所示。比较20项不同指标的预测精度,选择适合该领域知识网络的最优指标。以现有领域所有数据为数据集,预测并计算其在未来时间节点产生的新兴主题关联机会及其可能性。具体实验步骤如下。