《表1 实验数据集Tab.1 Experimental dataset》
为了验证该算法的普适性和有效性,实验部分首先选取了新浪官方公布的微博热点话题“徐玉玉案”,该话题事件范围为2017年6月2日—2017年7月21日,又增加了该话题时间内的“2017NBA总决赛”“李文星事件”“顺丰菜鸟‘数据断交门’”“四川‘格斗孤儿’”“中国式相亲鄙视链”5个话题,共计6个话题,使实验数据包括教育、体育、社会、科技、民生等多领域的一般性话题和热点话题,同时,选取2017年6月21日—6月22日两天时间内新浪微博上的所有话题数据,进行实验验证,使实验验证具有普适性。通过网络爬虫获取以上相关数据,同时爬取话题参与用户在对应时间内的历史消息微博数据。对得到数据进行预处理后,数据集统计情况如表1所示。由于爬取的微博话题的用户数据量较大,借助Spark平台实现本文算法(TSRank),使用Matlab仿真实验结果,通过多次实验的最优结果,设置控制衰减速率的参数λ=11 h。
图表编号 | XD0035550800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.10 |
作者 | 刘威、张明新、安德智 |
绘制单位 | 苏州大学计算机科学与技术学院、常熟理工学院计算机科学与工程学院、甘肃政法学院网络空间安全学院 |
更多格式 | 高清、无水印(增值服务) |