《表4 实验数据集(Dataset3)的构成》
为了让实验语料与真实社会中的事件分布更加接近,本研究从中国应急服务网中采集了2018年2月1日至2018年8月31日期间的事故灾难类、自然灾害类、公共卫生类突发事件语料,还从其他网络媒体上采集财经、娱乐、体育、科技等领域的热点事件语料,并将其加入到DataSet2中,从而形成最终的二元类别公共事件数据集Dataset3(具体描述如表4所示),即DataSet3由189条公共安全事件和993条非公共安全事件构成,其分布比例约为1∶5。
图表编号 | XD00137050000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.15 |
作者 | 王连喜 |
绘制单位 | 广东外语外贸大学非通用语种智能处理重点实验室、广东外语外贸大学信息科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |