《表1 微博数据集数量分布》

《表1 微博数据集数量分布》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于卷积神经网络的微博话题内容搜索方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

采用的数据集为爬取的新浪微博数据,时间跨度为从2009年9月2日至2016年9月7日的621 718条微博数据,其中238 726条微博为有效正例数据。正例数据中包括4类安全事件话题内容,分别为“恐怖袭击类”“意外伤害类”“医疗事故类”和“自然灾害类”。除将数据集分为正例、噪声数据外,将该数据集的70%用作训练集,30%用作测试集。数据分布如表1所示。