《表4 模型拟合汇总:面向新浪微博的情感社区检测算法》
实验抽取了两个比较活跃的话题进行了模块度计算,最后的模块度值是对5次结果求平均值取得的.结果如表4所示,可以看出SMB-LPA算法是6个算法中模块度值最大的,同时每次计算的模块度值差别不大,这也说明SMB-LPA算法具有很好的稳定性.LPA的模块度值差异较大,这是由标签传播算法的随机性造成的.SCD与GEMSEC算法的模块度值较小,这是由于聚类算法没有种子集作为起始标签,仅由节点的特征来进行聚类,而且节点的特征矩阵又较为稀疏,所以聚类的结果中很多社区只有单一一个节点,这样的原因也导致了算法检测出的社区数量非常多,算法的模块度与规范化互信息都很低.而Edmot算法通过边增强的方法,增强了输入网络的原始连接结构以生成重新连接的网络,从重新连接的网络中获得的社区数量较少,所以其模块度较高.虽然Edmot算法的模块度高,但是其规范化互信息较低,原因是虽然其划分出的社区数量少,但是划分的准确度低,与标注值的差异依然很大,所以其模块度高但是规范化互信息低.且由图9可知,SMB-LPA算法的规范化互信息高于其他的算法.
图表编号 | XD00186136300 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.01 |
作者 | 韩东红、张宏亮、朱帅伟、齐孝龙 |
绘制单位 | 东北大学计算机科学与工程学院、东北大学计算机科学与工程学院、东北大学计算机科学与工程学院、东北大学计算机科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |