《表1 网络舆情事件集示例》
因为没有公开的包含文本及图片的网络舆情事件数据集,本文从新浪博客中搜集了近两年发生的网络舆情事件数据。数据集包括近期发生的“响水化工厂爆炸”“重庆公交坠江”“台风山竹”等网络舆情事件。在搜集过程中,当网民所发的微博中包含数张图片时,选择其中最具有情感极性的一张图片作为代表图片。在表1中展示了其中的一个样本。搜集的数据集分别包含2128组文本和图片。在精确和细致的人工标注后,数据集的情感极性被分为正面、负面和中性三类,其中数量分别是712、768和649。除此之外,作者所在的研究组从新浪博客中抓取了近几年发生的网络舆情事件数据,用于训练词向量,清洗后总计2911235条文本。
图表编号 | XD00175577800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.26 |
作者 | 范涛、吴鹏、曹琪 |
绘制单位 | 南京理工大学经济管理学院、南京理工大学经济管理学院、中国科学院科技战略咨询研究院 |
更多格式 | 高清、无水印(增值服务) |