《表1 标准化语义合集:基于主题提取模型的交通违法行为文本数据的挖掘》

《表1 标准化语义合集:基于主题提取模型的交通违法行为文本数据的挖掘》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于主题提取模型的交通违法行为文本数据的挖掘》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

文本预处理是文本挖掘的第一步,也是文本挖掘较为重要且费时的一步。汉语文本的预处理技术主要包括中文分词、特征提取和特征表示。建立一个相对完整的标准化信息描述语义集合是进行文本数据挖掘前的关键[2],本文依据《道路交通事故信息代码》(GA16-2010)[10]标准中提取道路交通事故时间、伤亡人数、事故形态、事故认定原因、交通违法行为等7个属性项目,以验证该语义集合的有效性及可行性,构建了一套综合描述道路交通事故基本信息的标准化语义集合,参见表1。