《表1 相似性指标的计算公式》
注:N(xi)表示从xi出发长度为2的路径通过的节点,γ(s)等于xi,yj的LCLs中通过节点s的数量,N'(yj)表示与yj有共同邻居的y节点,D表示节点的度。
接下来我们探讨如何把BPLSM模型应用到双模网络中的链路预测问题,链路预测问题是网络信息应用的一个重要方向,其核心是根据已观测到的网络信息,预测网络中未来可能产生的连接。双模网络链路预测问题中最常用到的方法是相似性指标,这类方法的主要思想是衡量两个节点的相似性来代表他们连接的可能性大小,这类指标的构建大多以CN指标为基础,但是CN指标只考虑了两个节点间最短连接的节点数量,没有考虑这些节点的连接结构,因此许多学者提出了对CN指标的改进方法,例如,Daminelli等(2015)提出了基于局部社团连接(Local Community Link,LCL)的一系列指标(Community Adamic Adar Index,CAA;Community Jaccard Coefficient,CJC;Community Resource Allocation Index,CRA),不仅考虑了包含节点的数量,还把节点之间的连接结构引入了指标。而另一类基于投影的预测方法则更多地考虑了网络结构的信息,例如Gao和Chen(2016)提出的基于投影的链路预测方法(Potential Link Prediction,PLP)。具体定义如表1所示。
图表编号 | XD00139392100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.25 |
作者 | 黄丹阳、毕博洋、苗玉茵 |
绘制单位 | 广州腾讯科技有限公司数据分析组 |
更多格式 | 高清、无水印(增值服务) |