《表1 部分煤矿安全事故原始数据信息》

《表1 部分煤矿安全事故原始数据信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于文本聚类的煤矿安全事故类型分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

以中国各地煤矿自2016—2020年的435条煤矿安全事故记录为数据源,部分数据见表1,该数据记录了煤矿事故发生的时间、地点、责任单位及事故描述等信息,假设D为煤矿安全事故记录,则D=(x1,x2,x3,x4),其中,x1为事故发生时间,x2为事故发生地点,x3为事故责任单位,x4为事故描述[7]。由表1可知,每条事故记录的部分词语突出了该类事故独有的特点。从文本长度来看,安全事故记录的文本长度较长,每条记录的字符数一般大于20,这也造成无效特征词增多。从文本结构来看,安全事故记录属于非结构化数据,但是同类别事故描述的相似性较高。因此,可采用文本聚类方法对事故记录进行分析处理。