《表4 数据集分布表:多特征融合的可移植谣言早期检测模型》
微博与微信作为目前国内顶级流量平台,其数亿级的用户群体使得其中流动着海量信息,其中不乏网络谣言。2018年联合辟谣平台正式上线,至今已精确辟谣数千条网络谣言。此外,各大论坛及直播平台均有谣言滋生。因此,本文将从上述平台采集实验所需谣言数据。同时,为保证数据合理性,本文从网络开源新闻数据集中抽取部分语料作为非谣言数据。结合网络爬虫与正则表达式技术,最终,经聚类去重处理,为谣言识别任务构建的数据集分布情况如表4。
图表编号 | XD00150252400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.01 |
作者 | 孙王斌 |
绘制单位 | 中南大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |