《表1 微博数据集数量分布》
采用的数据集为爬取的新浪微博数据,时间跨度为从2009年9月2日至2016年9月7日的621 718条微博数据,其中238 726条微博为有效正例数据。正例数据中包括4类安全事件话题内容,分别为“恐怖袭击类”“意外伤害类”“医疗事故类”和“自然灾害类”。除将数据集分为正例、噪声数据外,将该数据集的70%用作训练集,30%用作测试集。数据分布如表1所示。
图表编号 | XD0036946100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.01 |
作者 | 周南、杜军平、姚旭、梁美玉、薛哲、LEE JangMyung |
绘制单位 | 北京邮电大学智能通信软件与多媒体北京市重点实验室计算机学院、北京邮电大学智能通信软件与多媒体北京市重点实验室计算机学院、北京邮电大学智能通信软件与多媒体北京市重点实验室计算机学院、北京邮电大学智能通信软件与多媒体北京市重点实验室计算机学院、北京邮电大学智能通信软件与多媒体北京市重点实验室计算机学院、釜山国立大学电子工程系 |
更多格式 | 高清、无水印(增值服务) |