《表1 部分煤矿安全事故原始数据信息》
以中国各地煤矿自2016—2020年的435条煤矿安全事故记录为数据源,部分数据见表1,该数据记录了煤矿事故发生的时间、地点、责任单位及事故描述等信息,假设D为煤矿安全事故记录,则D=(x1,x2,x3,x4),其中,x1为事故发生时间,x2为事故发生地点,x3为事故责任单位,x4为事故描述[7]。由表1可知,每条事故记录的部分词语突出了该类事故独有的特点。从文本长度来看,安全事故记录的文本长度较长,每条记录的字符数一般大于20,这也造成无效特征词增多。从文本结构来看,安全事故记录属于非结构化数据,但是同类别事故描述的相似性较高。因此,可采用文本聚类方法对事故记录进行分析处理。
图表编号 | XD00190340800 严禁用于非法目的 |
---|---|
绘制时间 | 2021.03.01 |
作者 | 蓝海英、何昊林、李玉翠、李千颖、李伊苧 |
绘制单位 | 中国矿业大学(北京)、中国矿业大学(北京)、中国矿业大学(北京)、中国矿业大学(北京)、中国矿业大学(北京) |
更多格式 | 高清、无水印(增值服务) |